当前位置：首页 > news >正文

6G内存运行Llama2-Chinese-7B-chat模型

news 2025/9/3 8:57:23

6G内存运行Llama2-Chinese-7B-chat模型

Llama2-Chinese中文社区

第一步：

从huggingface下载 Llama2-Chinese-7b-Chat-GGML模型放到本地的某一目录。

第二步：

执行python程序

git clone  https://github.com/Rayrtfr/llama2-webui.gitcd llama2-webui && pip install -r requirements.txt# 注意这里的/path/ggml-model-q4_0.bin换成你本地下载的模型路径
python app_4bit_ggml.py \
--model_path /path/ggml-model-q4_0.bin

本地浏览器打开: http://127.0.0.1:8090

请添加图片描述

查看全文

http://www.lryc.cn/news/105180.html

项目经理必备-项目总体计划模板-制式文件，可直接填写使用-公司可用

正则表达式系列|（以xx开头xx结尾提取、切分、替换）

金融学复习博迪(第1-5章）

【前端知识】React 基础巩固(三十七)——自定义connect高阶组件

前端PDF导出，使用html2Canvas和jsPDF插件

Android 设备兼容性使用详解

vnc加固

Windows下Nginx安装与配置教程

Iterator迭代器和Generator生成器

Modbus-RTU协议C#实现

Redis学习---大数据技术之Redis（NoSQL简介、Redis简介、Redis安装、五大数据类型、相关配置、持久化）

基于组合双向拍卖的共享储能机制研究(Matlab代码实现）

服务机器人有哪些品类

3.netty和protobuf

NLP实践——Llama-2 多轮对话prompt构建

《TCP IP网络编程》第十四章

网络基础-认识每层的设备和每层的特点用途

【Linux操作系统】深入解析Linux定时任务调度机制-cronat指令

动手学深度学习（一）预备知识

item_get-KS-获取商品详情

[华为OD] 最小传输时延(dijkstra算法)

问道管理：总资产大于总市值好吗？

IBM Spectrum LSF (“LSF“ ，简称为负载共享设施) 用户案例

Pytorch深度学习-----神经网络之非线性激活的使用(ReLu、Sigmoid)

Gis入门，使用起止点和两个控制点生成三阶贝塞尔曲线（共四个控制点，线段转曲线）

Web-7-深入理解Cookie与Session：实现用户跟踪和数据存储

Springboot设置Https

Windows 使用 Linux 子系统，轻轻松松安装多个linux

中级课程——弱口令（认证崩溃）

web自动化测试进阶篇05 ——— 界面交互场景测试

6G内存运行Llama2-Chinese-7B-chat模型

第一步：

第二步：

相关文章：