📋 Model Description


license: mit language:
  • ja
tags:
  • gpt-neox

stockmark-gpt-neox-japanese-1.4b-gguf

stockmarkさんが公開しているgpt-neox-japanese-1.4bのggufフォーマット変換版です。

注意:こちらはブランチで試用になります。llama.cpp本家にgptneoxが実装された時に、このggufファイルが使用できない可能性があります。

GitHubリポジトリの readme はこちら

Usage (試用)

git clone --branch mmnga-dev https://github.com/mmnga/llama.cpp.git
cd llama.cpp
make -j
./main -m 'stockmark-gpt-neox-japanese-1.4b-q40.gguf' -n 128 -p '吾輩は猫である。名前は実を言うと、'  --topp 0.9 --temp 0.7 --repeat-penalty 1.1

CUBLAS

LLAMA_CUBLAS=1 make -j
./main -m 'stockmark-gpt-neox-japanese-1.4b-q4_0.gguf' -n 128 -p '吾輩は猫である。名前は実を言うと、' -ngl 24

📂 GGUF File List

📁 Filename 📦 Size ⚡ Download
stockmark-gpt-neox-japanese-1.4b-q2_K.gguf
LFS Q2
582.87 MB Download
stockmark-gpt-neox-japanese-1.4b-q3_K_L.gguf
LFS Q3
784.04 MB Download
stockmark-gpt-neox-japanese-1.4b-q3_K_M.gguf
LFS Q3
728.04 MB Download
stockmark-gpt-neox-japanese-1.4b-q3_K_S.gguf
LFS Q3
622.04 MB Download
stockmark-gpt-neox-japanese-1.4b-q4_0.gguf
Recommended LFS Q4
788.01 MB Download
stockmark-gpt-neox-japanese-1.4b-q4_K_M.gguf
LFS Q4
873.51 MB Download
stockmark-gpt-neox-japanese-1.4b-q4_K_S.gguf
LFS Q4
796.01 MB Download
stockmark-gpt-neox-japanese-1.4b-q5_0.gguf
LFS Q5
944.22 MB Download
stockmark-gpt-neox-japanese-1.4b-q5_K_M.gguf
LFS Q5
1007.97 MB Download
stockmark-gpt-neox-japanese-1.4b-q5_K_S.gguf
LFS Q5
944.22 MB Download
stockmark-gpt-neox-japanese-1.4b-q6_K.gguf
LFS Q6
1.08 GB Download
stockmark-gpt-neox-japanese-1.4b-q8_0.gguf
LFS Q8
1.4 GB Download