Larsen Weigle's picture

66 3

Larsen Weigle

larsenweigle

https://larsenweigle.github.io/personalwebsite/

larsenweigle

AI & ML interests

NLP + Environmental Conservation

Recent Activity

liked a dataset 18 days ago

allenai/real-toxicity-prompts

upvoted a paper about 1 month ago

LongKey: Keyphrase Extraction for Long Documents

upvoted a paper about 2 months ago

RedPajama: an Open Dataset for Training Large Language Models

View all activity

Organizations

None yet

larsenweigle's activity

upvoted a paper about 1 month ago

LongKey: Keyphrase Extraction for Long Documents

Paper • 2411.17863 • Published Nov 26, 2024 • 11

upvoted a paper about 2 months ago

RedPajama: an Open Dataset for Training Large Language Models

Paper • 2411.12372 • Published Nov 19, 2024 • 48

upvoted 5 papers 2 months ago

Sample-Efficient Alignment for LLMs

Paper • 2411.01493 • Published Nov 3, 2024 • 10

HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems

Paper • 2411.02959 • Published Nov 5, 2024 • 65

What Happened in LLMs Layers when Trained for Fast vs. Slow Thinking: A Gradient Perspective

Paper • 2410.23743 • Published Oct 31, 2024 • 59

Can Knowledge Editing Really Correct Hallucinations?

Paper • 2410.16251 • Published Oct 21, 2024 • 54

LOGO -- Long cOntext aliGnment via efficient preference Optimization

Paper • 2410.18533 • Published Oct 24, 2024 • 42

upvoted 5 papers 3 months ago

UCFE: A User-Centric Financial Expertise Benchmark for Large Language Models

Paper • 2410.14059 • Published Oct 17, 2024 • 55

MLLM as Retriever: Interactively Learning Multimodal Retrieval for Embodied Agents

Paper • 2410.03450 • Published Oct 4, 2024 • 36

Aria: An Open Multimodal Native Mixture-of-Experts Model

Paper • 2410.05993 • Published Oct 8, 2024 • 107

Self-Boosting Large Language Models with Synthetic Preference Data

Paper • 2410.06961 • Published Oct 9, 2024 • 15

Differential Transformer

Paper • 2410.05258 • Published Oct 7, 2024 • 169

upvoted a paper 4 months ago

AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation Framework

Paper • 2308.08155 • Published Aug 16, 2023 • 3

upvoted 3 papers 5 months ago

Automated Design of Agentic Systems

Paper • 2408.08435 • Published Aug 15, 2024 • 39

OpenResearcher: Unleashing AI for Accelerated Scientific Research

Paper • 2408.06941 • Published Aug 13, 2024 • 30

LongWriter: Unleashing 10,000+ Word Generation from Long Context LLMs

Paper • 2408.07055 • Published Aug 13, 2024 • 65

upvoted 3 papers 6 months ago

Scaling Laws with Vocabulary: Larger Models Deserve Larger Vocabularies

Paper • 2407.13623 • Published Jul 18, 2024 • 53

SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity

Paper • 2401.17072 • Published Jan 30, 2024 • 25

Adam-mini: Use Fewer Learning Rates To Gain More

Paper • 2406.16793 • Published Jun 24, 2024 • 67

upvoted a paper 8 months ago

OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework

Paper • 2404.14619 • Published Apr 22, 2024 • 126