AI Papers Academy's picture

10 3

AI Papers Academy

aipapersacademy

·

AI & ML interests

None yet

Recent Activity

commented a paper 14 days ago

Byte Latent Transformer: Patches Scale Better Than Tokens

commented a paper 22 days ago

Training Large Language Models to Reason in a Continuous Latent Space

commented a paper about 1 month ago

Hymba: A Hybrid-head Architecture for Small Language Models

View all activity

Organizations

None yet

aipapersacademy's activity

commented a paper 14 days ago

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published 22 days ago • 80 •

commented a paper 22 days ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published 25 days ago • 64 •

commented a paper about 1 month ago

Hymba: A Hybrid-head Architecture for Small Language Models

Paper • 2411.13676 • Published Nov 20, 2024 • 39 •

commented 2 papers about 2 months ago

LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

Paper • 2411.09595 • Published Nov 14, 2024 • 71 •

TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters

Paper • 2410.23168 • Published Oct 30, 2024 • 24 •

commented 2 papers 4 months ago

Writing in the Margins: Better Inference Pattern for Long Context Retrieval

Paper • 2408.14906 • Published Aug 27, 2024 • 138 •

Sapiens: Foundation for Human Vision Models

Paper • 2408.12569 • Published Aug 22, 2024 • 89 •

commented a paper 5 months ago

Mixture of Nested Experts: Adaptive Processing of Visual Tokens

Paper • 2407.19985 • Published Jul 29, 2024 • 36 •

commented 2 papers 7 months ago

Mixture-of-Agents Enhances Large Language Model Capabilities

Paper • 2406.04692 • Published Jun 7, 2024 • 55 •

Transformers Can Do Arithmetic with the Right Embeddings

Paper • 2405.17399 • Published May 27, 2024 • 52 •