Skip to content

yportne13/qwen.rs

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

23 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

qwen.rs

一个非官方的使用 rust 实现的通义千问-7B-chat,能够在 cpu 上运行,不需要任何依赖。基于 candletiktoken-rs,大量参考了 candle 中的 llama 的例子。

实现了一个原始版本和一个量化版本(基于 ggml,但并不是标准的文件。基本按照 ggmlv3,未处理 align)。原始版本需要下载官方的权重文件(Hugging FaceModelScope)下的八个后缀为 .safetensors 的文件。量化版本所需的权重文件可以使用 release 页面下的 convert_ggml 程序来将原始权重文件转为 ggml 格式的文件。

使用方法

在你想要运行这个程序的目录下创建 weight 文件夹,将权重文件放入。

release 页面下载可执行文件,windows 就下 .exe 后缀的,linux 就下另一个,mac 的 ci 出了点问题没有导出。当在命令行看到 >>> 就可以开始对话了。如果闪退了一般是权重文件没有正确放置。

如果想要自行编译运行,下载安装 rust,然后克隆当前项目,并在当前项目下命令行输入 cargo run --release 即可。想生成可执行文件则是 cargo build --release,然后即可在 target/release 目录下找到可执行程序。

MKL

cargo build --release --features=mkl

Accelerate

cargo build --release --features=accelerate

使用协议

模型本身的协议参见官方仓库的说明。本仓库的代码为 Apache 和 MIT 协议。