当前位置: 首页 > news >正文

无公网IP 外网访问本地部署 llamafile 大语言模型

llamafile 是一种AI大模型部署(或者说运行)的方案,它的特点就是可以将模型和运行环境打包成一个独立的可执行文件,这样就简化了部署流程。用户只需要下载并执行该文件,无需安装运行环境或依赖库,这大大提高了使用大型语言模型的便捷性。

 

本文将详细的介绍如何在 Windows 系统电脑端下载运行llamafile ,并且结合路由侠内网穿透实现外网访问本地的llamafile 。

第一步,下载 llamafile

1,先下载llamafile,下载包:https://www.modelscope.cn/api/v1/models/bingal/llamafile-models/repo?Revision=master&FilePath=llamafile-0.6.2.win.zip

2,下载后,需要解压文件,解压后可以看到一个llamafile.exe文件,不用点击这个文件。

3,进入这个链接:魔搭社区,去下载对应的大语言模型,本文以下载的是第一个模型为例。

4,下载好后,把下载的大语言模型和上面我们下载的llamafile.exe文件放在一起。

5,在llamafile目录下,点击左上角文件,直接打开powershell命令窗口。

6,执行输入下面命令运行llamafile。

.\llamafile-0.6.2.exe -m .\Qwen-7B-Chat-q4_0.llamafile -ngl 9999 --port 8080 --host 0.0.0.0

.\llamafile-0.6.2.exe 表示运行llamafile;

.\Qwen-7B-Chat-q4_0.llamafile表示运行自己下载的大语言模型;

-ngl 999 表示调用GPU显卡运行;

8080 是web 界面访问端口,可以自己修改;

后面-host 默认即可。

7,打开浏览器,输入本地访问地址,就能看到 llama 的web ui 界面,这样表示启动就成功了

第二步,如何在外网访问本地局域网的llamafile

在内网的电脑上安装路由侠,点此下载

1,下载安装完成后,打开路由侠界面,点击【内网映射】。

2,点击【添加映射】。

3,选择【原生端口】。

4,在内网端口里填写默认端口 8080 后点击【创建】按钮,如下图。

5,创建好后,就可以看到一条映射的公网地址,鼠标右键点击【复制地址】。

6,在外网的浏览器的地址栏输入复制的外网地址就可以访问llamafile了。

 

http://www.lryc.cn/news/527600.html

相关文章:

  • 使用PC版本剪映制作照片MV
  • 搭建 docxify 静态博客教程
  • 汽车OEMs一般出于什么目的来自定义Autosar CP一些内容
  • Vue.js Vuex 模块化管理
  • 分布式光纤应变监测是一种高精度、分布式的监测技术
  • 用Devc++与easyx一步一步做游戏[启动界面部分]-解决hover闪烁问题及优化
  • mysql 学习3 SQL语句--整体概述。SQL通用语法;DDL创建数据库,查看当前数据库是那个,删除数据库,使用数据库;查看当前数据库有哪些表
  • 【数据结构】_链表经典算法OJ:分割链表(力扣—中等)
  • k8s支持自定义field-selector spec.hostNetwork过滤
  • ICSE‘25 LLM Assistance for Memory Safety
  • 《十七》浏览器基础
  • TikTok 推出了一款 IDE,用于快速构建 AI 应用
  • 阅读springboot源码 记录
  • Linux之内存管理前世今生(一)
  • Beautiful Soup 入门指南:从零开始掌握网页解析
  • 网络通信---MCU移植LWIP
  • Go-并行编程新手指南
  • 基于Django的个人博客系统的设计与实现
  • Python爬虫获取custom-1688自定义API操作接口
  • kaggle-ISIC 2024 - 使用 3D-TBP 检测皮肤癌-学习笔记
  • 滤波电路汇总
  • 1.Template Method 模式
  • MySQL分表自动化创建的实现方案(存储过程、事件调度器)
  • 基于回归分析法的光伏发电系统最大功率计算simulink建模与仿真
  • 计算机毕业设计【任务书】怎么写?
  • GRAPHARG——学习
  • 【Rust自学】15.6. RefCell与内部可变性:“摆脱”安全性限制
  • 14.模型,纹理,着色器
  • 【C语言分支与循环结构详解】
  • 新项目上传gitlab