Sergei Averkiev's picture

Sergei Averkiev

averoo

·

https://lingtra.in

averkij

AI & ML interests

None yet

Recent Activity

upvoted a paper 10 days ago

YuLan-Mini: An Open Data-efficient Language Model

upvoted a paper 10 days ago

MMFactory: A Universal Solution Search Engine for Vision-Language Tasks

upvoted a paper 10 days ago

Molar: Multimodal LLMs with Collaborative Filtering Alignment for Enhanced Sequential Recommendation

View all activity

Organizations

averoo's activity

upvoted 3 papers 10 days ago

YuLan-Mini: An Open Data-efficient Language Model

Paper • 2412.17743 • Published 14 days ago • 59

MMFactory: A Universal Solution Search Engine for Vision-Language Tasks

Paper • 2412.18072 • Published 13 days ago • 14

Molar: Multimodal LLMs with Collaborative Filtering Alignment for Enhanced Sequential Recommendation

Paper • 2412.18176 • Published 13 days ago • 15

upvoted a paper 13 days ago

Deliberation in Latent Space via Differentiable Cache Augmentation

Paper • 2412.17747 • Published 14 days ago • 28

upvoted 5 papers 14 days ago

Fietje: An open, efficient LLM for Dutch

Paper • 2412.15450 • Published 17 days ago • 3

Multi-LLM Text Summarization

Paper • 2412.15487 • Published 17 days ago • 5

Parallelized Autoregressive Visual Generation

Paper • 2412.15119 • Published 18 days ago • 49

SCOPE: Optimizing Key-Value Cache Compression in Long-context Generation

Paper • 2412.13649 • Published 19 days ago • 20

Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis

Paper • 2412.15322 • Published 17 days ago • 16

upvoted 2 papers 17 days ago

AniDoc: Animation Creation Made Easier

Paper • 2412.14173 • Published 18 days ago • 49

TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks

Paper • 2412.14161 • Published 18 days ago • 48

upvoted a paper 24 days ago

AgentTrek: Agent Trajectory Synthesis via Guiding Replay with Web Tutorials

Paper • 2412.09605 • Published 24 days ago • 26

upvoted 3 papers 27 days ago

EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

Paper • 2412.04862 • Published about 1 month ago • 49

CompCap: Improving Multimodal Large Language Models with Composite Captions

Paper • 2412.05243 • Published about 1 month ago • 18

PanoDreamer: 3D Panorama Synthesis from a Single Image

Paper • 2412.04827 • Published about 1 month ago • 10

upvoted 5 papers about 1 month ago

Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis

Paper • 2412.01819 • Published Dec 2, 2024 • 33

LLM Teacher-Student Framework for Text Classification With No Manually Annotated Data: A Case Study in IPTC News Topic Classification

Paper • 2411.19638 • Published Nov 29, 2024 • 6

Video Depth without Video Models

Paper • 2411.19189 • Published Nov 28, 2024 • 33

On Domain-Specific Post-Training for Multimodal Large Language Models

Paper • 2411.19930 • Published Nov 29, 2024 • 25

Puzzle: Distillation-Based NAS for Inference-Optimized LLMs

Paper • 2411.19146 • Published Nov 28, 2024 • 13