7 691 615

Kye Gomez

kye

https://discord.gg/qUtxnK2NMf

kyegomezb

AI & ML interests

Neuroscience, Behavior Science, Anti-Matter, Anti-Gravity propulsion,

Recent Activity

liked a Space 3 days ago

patrickbdevaney/Chat-With-Swarms.ai

liked a Space 5 days ago

harshalmore31/Swarms

upvoted a paper 17 days ago

FastVLM: Efficient Vision Encoding for Vision Language Models

View all activity

Organizations

kye's activity

upvoted 10 papers 17 days ago

FastVLM: Efficient Vision Encoding for Vision Language Models

Paper • 2412.13303 • Published 19 days ago • 13

ChatDiT: A Training-Free Baseline for Task-Agnostic Free-Form Chatting with Diffusion Transformers

Paper • 2412.12571 • Published 20 days ago • 8

VidTok: A Versatile and Open-Source Video Tokenizer

Paper • 2412.13061 • Published 20 days ago • 8

Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces

Paper • 2412.14171 • Published 18 days ago • 23

AnySat: An Earth Observation Model for Any Resolutions, Scales, and Modalities

Paper • 2412.14123 • Published 18 days ago • 11

Efficient Diffusion Transformer Policies with Mixture of Expert Denoisers for Multitask Learning

Paper • 2412.12953 • Published 20 days ago • 11

Mix-LN: Unleashing the Power of Deeper Layers by Combining Pre-LN and Post-LN

Paper • 2412.13795 • Published 19 days ago • 18

TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks

Paper • 2412.14161 • Published 18 days ago • 48

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published 19 days ago • 116

No More Adam: Learning Rate Scaling at Initialization is All You Need

Paper • 2412.11768 • Published 21 days ago • 41

upvoted a paper 19 days ago

Are Your LLMs Capable of Stable Reasoning?

Paper • 2412.13147 • Published 19 days ago • 91

upvoted 5 papers 20 days ago

Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models

Paper • 2412.09645 • Published 26 days ago • 35

RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation

Paper • 2412.11919 • Published 21 days ago • 33

upvoted 4 papers 23 days ago

ILLUME: Illuminating Your LLMs to See, Draw, and Self-Enhance

Paper • 2412.06673 • Published 28 days ago • 11

Perception Tokens Enhance Visual Reasoning in Multimodal Language Models

Paper • 2412.03548 • Published Dec 4, 2024 • 17

ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer

Paper • 2412.07720 • Published 26 days ago • 30

Mogo: RQ Hierarchical Causal Transformer for High-Quality 3D Human Motion Generation

Paper • 2412.07797 • Published Dec 5, 2024 • 11