Streamlit 能当轻量数据面板用但非BI工具,适合内部快速共享分析结果;需用st.cache_data缓存数据、st.session_state保存状态、Plotly图表提升交互性,并注意部署时依赖和路径问题。

Streamlit 能不能直接当数据面板用
能,但得清楚它不是 BI 工具——没有权限控制、不支持多用户会话隔离、默认不存状态。适合内部快速共享分析结果,比如给同事看一个模型预测效果或每日数据监控快照。
常见错误现象:st.session_state 在刷新后丢失、图表交互后数据没更新、st.cache_data 没加导致反复重跑耗时函数。
- 用
st.cache_data包裹数据加载逻辑(如读 CSV、查数据库),别用st.cache(已弃用) - 交互控件(如
st.slider、st.selectbox)必须放在顶层作用域,不能藏在 if 或函数里,否则每次 rerun 都重置 - 避免在脚本顶层写耗时操作(如训练模型),放到按钮回调或缓存函数里
怎么让 pandas DataFrame 变成可交互表格
直接 st.dataframe(df) 最省事,但默认不支持排序/筛选/导出。真要这些功能,得靠 st_aggrid 这类第三方组件,不过会增加部署复杂度。
使用场景:临时查数据、展示清洗中间结果、给非技术人员看结构化输出。
st.dataframe(df, use_container_width=True)让表格自适应宽度,不然小屏会横向滚动- 想高亮异常值?用
df.style.highlight_max()再传给st.dataframe() - 别对超大
DataFrame(>10 万行)直接调用st.dataframe,浏览器会卡;先df.head(5000)或加分页逻辑
图表更新不同步、点击没反应怎么办
根本原因是 Streamlit 的执行模型:每次交互都会从头运行整个脚本,变量不保留,除非你显式用 st.session_state 存。
典型错误:fig = plt.figure() 放在按钮外面,点按钮后图表还是旧的;或者用 st.button 但没处理返回值,导致逻辑没触发。
- 所有依赖控件的计算和绘图,必须写在控件之后,且包裹在条件判断里,例如:
if st.button("重算"): result = heavy_calc(); st.plotly_chart(result) - 用
st.session_state保存用户选择项,比如:if "selected_col" not in st.session_state: st.session_state.selected_col = "sales" - Plotly 图比 Matplotlib 更友好——支持缩放、悬停、导出,优先用
st.plotly_chart(fig, use_container_width=True)
部署到公网后打不开、报错 ModuleNotFoundError
本地跑通 ≠ 部署成功。Streamlit Cloud、Render、Vercel 这些平台不会自动装你本地环境里的包,requirements.txt 必须显式列出所有依赖,包括 pandas、plotly、numpy,甚至 streamlit 自己。
容易被忽略的点:路径问题。本地用 pd.read_csv("data.csv") 没问题,部署后文件不在当前目录,得用相对路径或明确指定 os.path.join(os.path.dirname(__file__), "data.csv")。
requirements.txt里别写-e .或本地路径,只放 PyPI 可安装的包名+版本- Streamlit Cloud 不支持后台进程、不支持读写本地文件系统(除了
st.file_uploader上传的临时文件) - 用
st.secrets管理 API Key 或数据库密码,别硬编码,也别放进 Git