📌Marlin-2B — компактна VLM для аналізу відео з точними таймкодами
На Hugging Face з’явилася Marlin-2B — невелика відео VLM-модель, яка вміє знаходити події у відео та створювати структурований опис сцен із точністю до секунд.
🔆Детальніше:
• модель має лише 2B параметрів, але конкурує з Gemini 2.5 Flash у своїй категорії
• marlin.caption() створює структурований JSON з описом сцен та подій
• усі події отримують точні таймкоди з прив’язкою до секунд
• marlin.find() дозволяє знаходити потрібні моменти у відео через запит природною мовою
• модель повертає часові проміжки початку та завершення подій
• Marlin-2B створювалася для роботи з відеоагентами та автоматизації аналізу контенту
• розробники окремо акцентують увагу на низькій вартості запуску порівняно з великими VLM
• модель вже доступна з відкритими weights на Hugging Face
➡️Weights тут.
➡️Спробувати тут.
➡️Запроси друга до НейроЄнота🦝
📌Marlin-2B — компактна VLM для аналізу відео з точними таймкодами
Нейроєнот | Нейромережа Midjourney, chat GPT та інші
@neuroenotЗахопливо про нейромережі та проривні технології. Ласкаво просимо у майбутнє. Заявки приймаю миттєво. Для друга: https://t.me/neuroenot Промпти: https://t.me/prompt_ua Співпраця та зв'язок: @New_Life_Technology Тицькай кнопочку👇🏻
14,624 subscribers
Open in Telegram Full media available on Creator+ channels
1 video is attached to this post — visible in the Telegram app.