当前位置: 首页 > news >正文

使用Termux将安卓手机变成随身AI服务器(page assist连接)

在这里插入图片描述

通过以下方法在安卓手机上运行 Ollama 及大模型,无需 Root 权限,具体方案如下:


  1. 通过 Termux 模拟 Linux 环境运行
  • 核心工具:
    • 安装 (安卓终端模拟器)()]。
    • 借助 proot-distro 工具安装 Linux 发行版(如 Debian)()]。
  • 操作步骤:
    1. 在 Termux 中运行命令安装依赖:
      pkg update && pkg install proot-distro  
      proot-distro install debian  
      proot-distro login debian  
      
    2. 在 Debian 环境中安装 Ollama:
      curl -fsSL https://ollama.com/install.sh | sh  
      
    3. 启动服务并运行模型:
      ollama serve &  
      ollama run deepseek-r1:1.5b  # 以 DeepSeek-R1 为例()]  
      

  1. 直接使用预编译的 Ollama 二进制文件 (推荐)
  • 适用场景:若手机性能较弱或不想配置复杂环境。
  • 操作步骤:
    1. 在 Termux 中下载 Ollama 的 ARM64 版本:
      pkg install ollama
      
    2. 直接运行模型:
      # 以下修改监听和允许跨域是远程访问必要参数  
      # 修改监听地址
      export OLLAMA_HOST=0.0.0.0:11434
      # 允许跨域访问
      export OLLAMA_ORIGINS=*
      # 后台启动监听
      ollama serve &
      # 拉取deepseek-r1:7b模型
      ollama run deepseek-r1:7b
      
      参数与性能调优
      环境变量控制:
      OLLAMA_FLASH_ATTENTION=1:启用注意力机制加速,提升模型推理速度。
      OLLAMA_NUM_PARALLEL=16:设置并行处理请求数,优化多任务性能。
      Ollama支持的其他环境变量主要包括:
      OLLAMA_HOST:定义服务监听地址(如 0.0.0.0:11434)。
      OLLAMA_KEEP_ALIVE:设置模型在内存中的存活时间(如 24h)。
      OLLAMA_MAX_LOADED_MODELS:限制同时加载的模型数量(默认1)。
      OLLAMA_NUM_THREADS=8 根据CPU核心数调整(如8核)。
      OLLAMA_NUM_PARALLEL:设置并行请求处理数(默认1)。
      OLLAMA_MODELS:自定义模型存储路径。
      OLLAMA_METRICS_ENABLED=true 启用prometheus监控指标输出,访问http://localhost:11434/metrics。

  1. page assist的设置
    在这里插入图片描述

  1. 性能与注意事项
  • 硬件要求:
    • 手机需支持 ARM64 架构(主流安卓机均兼容)。
    • 运行 1.5B~8B 参数的模型需至少 4GB 内存。
  • 局限性:
    • 大模型(如 70B)因算力限制无法流畅运行。
    • 需保持 Termux 后台常驻,避免进程中断]。
  • 优化建议:
    • 使用 & 后台运行命令(如 ollama serve &)。
    • 优先选择量化版模型(如 4bit 精度)减少资源占用]。

总结
通过 Termux + Linux 环境或直接运行二进制文件,可在安卓手机上部署 Ollama 并运行中小规模模型(如 DeepSeek-R1、Llama3-8B)。

http://www.lryc.cn/news/540044.html

相关文章:

  • MacOS安装Emacs
  • OpenCV机器学习(10)训练数据的一个核心类cv::ml::TrainData
  • 3.1 actor基本框架(c#的Akka.Actor模式)
  • Git使用[同一电脑多个账户ssh-key的管理]
  • 使用Python结合`stable-baselines3`库(包含PPO和TD3算法)以及`gym`库来实现分层强化学习的示例代码
  • 【论文笔记】MambaGlue: Fast and Robust Local Feature Matching With Mamba
  • 基于 Stanford CoreNLP 的中文自然语言处理
  • python 量化交易入门到提升详细教程,python量化交易教程
  • 如何设置爬虫的访问频率?
  • 前端循环全解析:JS/ES/TS 循环写法与实战示例
  • 大气体育直播模板赛事扁平自适应模板源码
  • vue3学习1
  • java机器学习计算指标动态阈值
  • mac os设置jdk版本
  • Python正则表达式学习
  • ShenNiusModularity项目源码学习(10:ShenNius.FileManagement项目分析)
  • mysql查看binlog日志
  • Node.js高频面试题精选及参考答案
  • TaskBuilder创建客户信息列表页面
  • Linux Iptables示例一则
  • 新手小白如何挖掘cnvd通用漏洞之存储xss漏洞(利用xss钓鱼)
  • 【CXX】4 跨平台构建系统特性对比
  • MySQL 如何使用EXPLAIN工具优化SQL
  • 沃丰科技大模型标杆案例|周大福集团统一大模型智能服务中心建设实践
  • 代码随想录day16
  • 常见的软件测试模型及特点
  • tailwindcss学习01
  • C语言复杂度分析
  • DeepSeek服务器繁忙 多种方式继续优雅的使用它
  • Bootstrap Blazor UI 中 <Table> 组件 <TableColumn> 使用备忘01:EF Core 外码处理