Cao's picture

5 3

Cao

JiaxinTsao

AI & ML interests

None yet

Organizations

JiaxinTsao's activity

New activity in meta-llama/Meta-Llama-3-70B-Instruct 9 months ago

Anyone else encountering bad quantized(?) performance with Llama3-70B?

#37 opened 9 months ago by

New activity in databricks/dbrx-instruct 10 months ago

SiLU or GLU activation?

#21 opened 10 months ago by

New activity in google/gemma-7b-it 11 months ago

No `lm_head.weight` in checkpoint ?

#31 opened 11 months ago by

New activity in mistralai/Mixtral-8x7B-Instruct-v0.1 12 months ago

can not run sft full finetuning.

#74 opened about 1 year ago by

New activity in Qwen/Qwen-14B-Chat about 1 year ago

如何让模型输出的结果，严格按照定义的json结构进行输出？

#12 opened about 1 year ago by