📌Marlin-2B — компактна VLM для аналізу відео з точними таймкодами

Нейроєнот | Нейромережа Midjourney, chat GPT та інші

Нейроєнот | Нейромережа Midjourney, chat GPT та інші

@neuroenot

Захопливо про нейромережі та проривні технології. Ласкаво просимо у майбутнє. Заявки приймаю миттєво. Для друга: https://t.me/neuroenot Промпти: https://t.me/prompt_ua Співпраця та зв'язок: @New_Life_Technology Тицькай кнопочку👇🏻

14,624 subscribers
Open in Telegram
Full media available on Creator+ channels
📌Marlin-2B — компактна VLM для аналізу відео з точними таймкодами

На Hugging Face з’явилася Marlin-2B — невелика відео VLM-модель, яка вміє знаходити події у відео та створювати структурований опис сцен із точністю до секунд.

🔆Детальніше:

• модель має лише 2B параметрів, але конкурує з Gemini 2.5 Flash у своїй категорії

marlin.caption() створює структурований JSON з описом сцен та подій

• усі події отримують точні таймкоди з прив’язкою до секунд

marlin.find() дозволяє знаходити потрібні моменти у відео через запит природною мовою

• модель повертає часові проміжки початку та завершення подій

• Marlin-2B створювалася для роботи з відеоагентами та автоматизації аналізу контенту

• розробники окремо акцентують увагу на низькій вартості запуску порівняно з великими VLM

• модель вже доступна з відкритими weights на Hugging Face

➡️Weights тут.
➡️Спробувати тут.

➡️Запроси друга до НейроЄнота🦝
1 video is attached to this post — visible in the Telegram app.
Open post in Telegram