DeepSeek Step by Step（3）——构建web化访问页面

追梦IT人 2025-02-13

198

如前文所述，构建web化访问页面有多种方式，flask、streamlit、gradio都可以，也看过很多基于streamlit、gradio开发简单机器学习和人工智能的页面，毕竟内置了很多组件，这些组件自带CSS，比flask从头到尾构建还是快速很多，虽然笔者对后两者没怎么研究过，但不妨碍就学习deepseek而言只是做个尝试性的demo。

Streamlit 和 Gradio 都是用于构建和部署机器学习应用的工具，deepseek给出的建议是如果你需要构建复杂的数据科学应用或高度定制化的界面，Streamlit 是更好的选择；如果你只需要快速部署和分享机器学习模型，Gradio 更加轻便和高效。就简单实现deepseek对话框而言，个人认为streamlit更加美观和易懂一些。

在streamlit代码中实现流式和批量输出两种模式，就感知而言，当然是流式数据获取和前端流式数据输出更加流畅一些。

import streamlit as st
import requests
import json

# 设置本地DeepSeek API的URL


DEEPSEEK_API_URL = "http://localhost:12345/api/generate"
headers = {"Content-Type": "application/json"}
streamflag=False

# 设置Streamlit页面标题
st.title("DeepSeek 本地对话界面")

# 初始化会话状态
if "messages" not in st.session_state:
    st.session_state.messages = []

# 显示历史消息
for message in st.session_state.messages:
    with st.chat_message(message["role"]):
        st.markdown(message["content"])

# 用户输入
if prompt := st.chat_input("请输入你的问题："):
    # 添加用户消息到会话状态
    st.session_state.messages.append({"role": "user", "content": prompt})
    with st.chat_message("user"):
        st.markdown(prompt)
    # 定义请求的数据
    data = {
        "model": "deepseek-r1:14b",  # 替换为你的本地模型名称
        "prompt": prompt,
        "stream": True  # 启用流式响应为True，不启用为False
    }
    contentjson = json.dumps(data)

    # ---------------------------------------非流式响应的代码----------------------------------------------
    # try:
    #     response = requests.post(DEEPSEEK_API_URL, headers=headers, data=contentjson)
    #     response.raise_for_status()  # 检查响应状态码
    #     result = response.json()
    #     returntxt=result['response']
    #     returntxt=returntxt.replace('<think>\n\n</think>\n\n','').replace('<think>','').replace('</think>','')
    #     st.markdown(returntxt)
    # except Exception as e:
    #     st.error(f"调用API时出错：{str(e)}")

    # ---------------------------------------流式响应的代码----------------------------------------------
    # 发送请求并处理流式响应
    with st.chat_message("assistant"):
        response_placeholder = st.empty()  # 创建一个占位符用于流式更新
        full_response = ""
        try:
            # 发送POST请求
            with requests.post(DEEPSEEK_API_URL, headers=headers, data=contentjson, stream=True) as response:
                if response.status_code == 200:
                    # 逐行读取流式响应
                    for line in response.iter_lines():
                        if line:
                            # 解析JSON数据
                            decoded_line = line.decode("utf-8") # 转码
                            chunk = json.loads(decoded_line)    # 将字符串类型的字典转为真正的字典类型
                            # 解析返回内容
                            # 判断是否有返回内容
                            if 'response' in chunk:
                                piece = chunk['response']       # 获取返回内容
                                piece=piece.replace('<think>\n\n</think>\n\n','').replace('<think>','').replace('</think>','')  # 对一些符号进行额外处理
                                if piece !='':
                                    full_response += piece
                                    response_placeholder.markdown(full_response)  # 更新占位符内容
                else:
                    st.error(f"API调用失败，状态码：{response.status_code}")
        except Exception as e:
            st.error(f"调用API时出错：{str(e)}")

    # 将助手回复添加到会话状态
    st.session_state.messages.append({"role": "assistant", "content": full_response})

这里只需要执行一下相关命令即可

streamlit run deepseekV3.0.py

运行的效果如下：

在gradio代码中只实现了批量输出模式，关于流式的实在不想找了。

import gradio as gr
import json,requests

DEEPSEEK_API_URL = "http://localhost:12345/api/generate"
headers = {"Content-Type": "application/json"}
streamflag=False


def generate_response(prompt):
    """通过Ollama API生成响应"""
    content = {
        "model": "deepseek-r1:14b",  # 模型名称
        "prompt": prompt,  # 输入的提示信息
        "stream": True  # 是否使用流式响应
    }
    contentjson = json.dumps(content)
    response = requests.post(DEEPSEEK_API_URL, headers=headers, data=contentjson, stream=True)
    response.raise_for_status()
    generated_text = ""
    for line in response.iter_lines():
        if line:
            decoded_line = line.decode('utf-8')
            chunk = json.loads(decoded_line)
            if 'response' in chunk:
                piece = chunk['response']  # 获取返回内容
                piece = piece.replace('<think>\n\n</think>\n\n', '').replace('<think>', '').replace('</think>','')  # 对一些符号进行额外处理
                if piece != '':
                    generated_text += piece
    return generated_text.strip()  # 返回最终的文本，去除最后的换行符

# 创建Gradio界面
iface = gr.Interface(fn=generate_response, inputs=gr.components.Textbox(lines=3, label="输入你的提示"), outputs="text",
                     live=True)
iface.launch()