Це згенероване фото і спочатку можна подумати, що фото як фото і нічого цікавого нема, але тут є тро

Нотатки Деапула

Нотатки Деапула

@diary_of_deapul

Глянь на світ з нового ракурсу. Автор - @deapul Всі думки мої і не відображають погляди Google.

752 subscribers
Open in Telegram
Це згенероване фото і спочатку можна подумати, що фото як фото і нічого цікавого нема, але тут є трохи більше історії.

До нового релізу від OpenAI жодна АІ модель не могла нормально згенерувати фото, де вино наповнене повністю. Чому так?

Все зводиться до того, що в глобальному датасеті прикладів, фото вина наповненого повністю в бокалі майже немає, бо для цілей маркетингу бокал завжди наповнювався частково, щоб вино виглядало більш привабливо.

Через це, який би промт не задавався, він би все одно генерував коряво цю картинку.

Але тепер достатньо задати:

make me an image of a glass of wine filled to the brim like it's about to spill over


І воно робить все правильно. Чому це цікавий кейс?

Цей приклад показує те, що АІ моделі починають більш точно робити екстраполяцію характеристик світу.

В даному випадку модель змогла ідентифікувати ідею бокала, ідею вина і точно показати, як буде вино виглядити у повністю заповненому бокалі без відсилок на існуючий датасет.
1 photo is attached to this post — visible in the Telegram app.
Open post in Telegram