ChatRWKV - ChatRWKVはChatGPTに似ていますが、RWKV(100%RNN)言語モデルとオープンソースを利用しています。

(ChatRWKV is like ChatGPT but powered by RWKV (100% RNN) language model, and open source.)

Created at: 2023-01-13 16:07:40
Language: Python
License: Apache-2.0

チャットRWKV

ChatRWKVはChatGPTに似ていますが、私のRWKV(100%RNN)言語モデルを搭載しており、これは(今のところ)トランスフォーマーに匹敵すると同時に、高速でVRAMを節約できる唯一のRNNです。

RWKV-4ウェイトをダウンロード:https://huggingface.co/BlinkDL(RWKV-4モデルを使用してください。RWKV-4aおよびRWKV-4bモデルは使用しないでください。

RWKV LM:https://github.com/BlinkDL/RWKV-LM(説明、微調整、トレーニングなど)

RWKV不和:https://discord.gg/bDSBUMeFpc(一緒に構築しましょう)

RWKV-評価

それはまだ会話のために指示調整されていないので、直接何かをするように頼まないでください(それが簡単な質問でない限り)。

"Instruct-test1" RWKV-4 モデル(1B5/3B/7B https://huggingface.co/BlinkDL で利用可能)については、プロンプトの例については https://huggingface.co/datasets/bigscience/xP3all/viewer/en/train を確認してください。

+gen \nQ: prompt\n\nA:

すべてのRWKV-4モデルについて、素晴らしいQ&Aプロンプト:

+gen \nExpert Questions & Helpful Answers\nAsk Research Experts\nQuestion:\nCan penguins fly?\n\nFull Answer:\n

+gen \nAsk Expert\n\nQuestion:\nCan penguins fly?\n\nExpert Full Answer:\n

その他の例:

+gen Here is a short story in which Jeff Bezos, Elon Musk, and Bill Gates fight in a tournament:

+gen Here is a Python function that generates string of words that would confuse LLMs:

+gen List of penguin facts:\n1.

+qa Can penguins fly?

+gen $ curl -i https://google.com/

+gen The following is the contents of https://en.wikipedia.org/wiki/Internet:

+gen Bob's Blog - Which is better, iOS or Android?

ユーザーからのチャットの例:チャットRWKV

中文模型

QQ群 143626394(加入时请简单自我介绍)。

在 chat.py 修改 CHAT_LANG 为 Chinese,修改 MODEL_NAME 为你下载的模型路径。

必须下载双语模型(EngChn),选日期最新的。

大模型:7B 参数,需 14G 显存,效果好(以后可以优化显存占用和速度,但现在忙): https://huggingface.co/BlinkDL/rwkv-4-pile-7b/tree/main

中模型:3B 参数,需 6G 显存,效果中等: https://huggingface.co/BlinkDL/rwkv-4-pile-3b/tree/main

小模型:1.5B 参数 ,需 3G 显存,效果差些: https://huggingface.co/BlinkDL/rwkv-4-pile-1b5/tree/main

如果没显卡,或者显存不够,可以用 CPU 模式(很慢)。

试试这些指令:

+qa 奶茶好喝吗?
+qa 猫喜欢做什么?
+qa How can I learn Python?
+qa 猫会编程吗?
+qa 知乎大V有哪些特点?

+qq 请以《我的驴》为题写一篇作文
+qq 请以《企鹅》为题写一首诗歌

+gen 二向箔是一种超级武器,它的原理是
+gen 我抬头一看,竟然是
+gen 创业思路:\n1.
+gen import torch