使用 Streamlit 在 Web 上进行数据科学

发布日期:2026-07-03 21:30:04   来源 : 杭州电子商务研究院    浏览量 :4
杭州电子商务研究院 发布日期:2026-07-03 21:30:04  
4

介绍

数据科学涉及使用科学方法提取信息和见解并将其呈现给相关利益相关者。自定义数据科学工具通常以 Python 等语言的程序或脚本形式开发。为了传达他们的见解,数据科学家可能会发现很难共享脚本和程序,尤其是当受众不是技术人员时。他们可能还需要基于网络的资源来接触更广泛的受众。

使用简单、最小的界面在 Web 上执行数据科学的需求催生了开源 Python 库Streamlit。数据科学家、数据分析师、机器学习工程师和商业智能开发人员高度评价 Streamlit 是构建 Web 数据应用程序的最快方法。

本指南将通过示例应用程序探索该库。

假设您是初创公司的数据科学家。您被选中为公司的客户设计和开发一款交互式工具,这家酿酒厂收集了葡萄酒的化学成分数据。该公司希望拥有一个界面,他们可以在其中与数据集交互、根据需要构建简单的可视化效果以及从数据中筛选列。

客户无法参加实体会议,但可以远程会议。他们希望有一个可以进行简单选择的交互式界面。对于此任务,您选择使用 Streamlit 托管界面以与客户共享。

本指南假设您至少具有中级Python 知识并具有一些数据科学经验。

设置

要开始使用 Streamlit,请通过终端中的以下命令下载它。

      pip install streamlit
streamlit hello
    

如果 Streamlit 在浏览器上打开并运行,则表示安装成功。创建一个新的 Python 文件并将其命名为app.py

示例应用程序

导入所需的库并设置页面标题和欢迎文本。

      import streamlit as st
import pandas as pd

st.title("Winery Inc. Welcome")
st.header("Data Visualization Board for Winery Inc Chemical Components")
wine = pd.read_csv("wine_data.csv")
    

示例数据

以下数据为 CSV 格式,摘录自葡萄酒数据集。生成更多值以构建示例数据集,并将文件保存为wine_data.csv

      date,pH,sulphur dioxide,acidity,color
20-11-2019,0.025,2,4,white
21-11-2019,0.015,6,3,red
22-11-2019.0.147,2,7,red
    

可视化数据框并提供选择用户想要查看的列的选项。

      selected_columns = st.multiselect('Select desired Columns', wine.columns.to_list(), default=['acidity','pH'])
st.dataframe(wine[selected_columns])
    

显示以选定列作为输入的折线图。允许选择使用户能够比较可视化中的多个列。日期列显示记录读数的日期。此列用作图表的索引和X 轴

      st.line_chart(wine[selected_columns].rename(columns={'date':'index'}).set_index('index'))
    

通过上述设置,界面允许用户选择要在数据集和图表中查看的列。

运行项目

要运行你的项目,请在终端上执行以下命令

      streamlit run app.py
    

该项目将在本地地址和端口localhost:8501 的默认浏览器上运行

结论

通过 Streamlit 将数据科学和分析引入网络,您可以轻松与同事和公众分享您的数据科学项目和研究。这项技能最适合数据分析师、数据科学家和商业智能开发人员等职位。

为了进一步了解本指南,请在Heroku上注册一个免费帐户并按照本指南上传您的数据科学机器学习或数据分析项目。

以上内容来自杭州电子商务研究院推送
关注
关于我们
热门推荐
合作伙伴
免责声明:本站部分资讯来源于网络,如有侵权请及时联系客服,我们将尽快处理
Copyright © 2025-2027 ToB产业网址导航 公安备案 浙公网安备33010602013138号 浙ICP备16025413号-9
支持 反馈 关注 数据