📋 Model Description
license: mit language:
- ja
- gpt-neox
stockmark-gpt-neox-japanese-1.4b-gguf
stockmarkさんが公開しているgpt-neox-japanese-1.4bのggufフォーマット変換版です。注意:こちらはブランチで試用になります。llama.cpp本家にgptneoxが実装された時に、このggufファイルが使用できない可能性があります。
Usage (試用)
git clone --branch mmnga-dev https://github.com/mmnga/llama.cpp.git
cd llama.cpp
make -j
./main -m 'stockmark-gpt-neox-japanese-1.4b-q40.gguf' -n 128 -p '吾輩は猫である。名前は実を言うと、' --topp 0.9 --temp 0.7 --repeat-penalty 1.1
CUBLAS
LLAMA_CUBLAS=1 make -j
./main -m 'stockmark-gpt-neox-japanese-1.4b-q4_0.gguf' -n 128 -p '吾輩は猫である。名前は実を言うと、' -ngl 24
📂 GGUF File List
| 📁 Filename | 📦 Size | ⚡ Download |
|---|---|---|
|
stockmark-gpt-neox-japanese-1.4b-q2_K.gguf
LFS
Q2
|
582.87 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q3_K_L.gguf
LFS
Q3
|
784.04 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q3_K_M.gguf
LFS
Q3
|
728.04 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q3_K_S.gguf
LFS
Q3
|
622.04 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q4_0.gguf
Recommended
LFS
Q4
|
788.01 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q4_K_M.gguf
LFS
Q4
|
873.51 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q4_K_S.gguf
LFS
Q4
|
796.01 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q5_0.gguf
LFS
Q5
|
944.22 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q5_K_M.gguf
LFS
Q5
|
1007.97 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q5_K_S.gguf
LFS
Q5
|
944.22 MB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q6_K.gguf
LFS
Q6
|
1.08 GB | Download |
|
stockmark-gpt-neox-japanese-1.4b-q8_0.gguf
LFS
Q8
|
1.4 GB | Download |