word v1.8

Files changed (5) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -6,10 +6,10 @@ tags:
 - mlx
 - llama3
 - retrieverapp
-- orig
 ---
-RetrieverApp *word* model version 1.4
 QLORA Fine-tuned, quantized (4bits), `mlx` compatible RetrieverApp model based on Llama3-8B-IT.
-It's finetuned to predict the `data_type`, `disease_type` and `organism` tags of GEO series data.

 - mlx
 - llama3
 - retrieverapp
+- word
 ---
+RetrieverApp *word* model version 1.8 (trained with curated labels)
 QLORA Fine-tuned, quantized (4bits), `mlx` compatible RetrieverApp model based on Llama3-8B-IT.
+It's finetuned to predict the `data_type` and `organism` tags of GEO series data.

config.json CHANGED Viewed

@@ -6,6 +6,7 @@
     "attention_dropout": 0.0,
     "bos_token_id": 128000,
     "eos_token_id": 128009,
     "hidden_act": "silu",
     "hidden_size": 4096,
     "initializer_range": 0.02,
@@ -21,12 +22,16 @@
         "group_size": 64,
         "bits": 4
     },
     "rms_norm_eps": 1e-05,
     "rope_scaling": null,
     "rope_theta": 500000.0,
     "tie_word_embeddings": false,
     "torch_dtype": "bfloat16",
-    "transformers_version": "4.43.3",
     "use_cache": true,
     "vocab_size": 128256
 }

     "attention_dropout": 0.0,
     "bos_token_id": 128000,
     "eos_token_id": 128009,
+    "head_dim": 128,
     "hidden_act": "silu",
     "hidden_size": 4096,
     "initializer_range": 0.02,
         "group_size": 64,
         "bits": 4
     },
+    "quantization_config": {
+        "group_size": 64,
+        "bits": 4
+    },
     "rms_norm_eps": 1e-05,
     "rope_scaling": null,
     "rope_theta": 500000.0,
     "tie_word_embeddings": false,
     "torch_dtype": "bfloat16",
+    "transformers_version": "4.45.1",
     "use_cache": true,
     "vocab_size": 128256
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7df41a3fd48ae1217fb17dc57b6b7e55d6ddd52a60cf9426f953b0068d89347a
 size 4517489037

 version https://git-lfs.github.com/spec/v1
+oid sha256:56d0c395512344e527116a8959f5f228734a338ee1f6306d0bb3d1c00ca76360
 size 4517489037

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff