☕️ Кава з пінкоюнотатки про ШІ, технології та творчість
Читати в Telegram →
31 серпня 2025 · переглядів у Telegram

AI-автоматизація метадати для фотостоків: локальний пайплайн на GPT + RAG

✅ Створення метадати завершено

📂 Файлів: 27

⏱ Час всього: 34 хв 00 сек

⏱ Середнє: 1.26 хв/фото

Чисто зафіксувати момент для себе - перша серія генерованих фото, прописана власною автоматичною системою кейвординга для фотобанків. Допиляв цей механізм, нарешті.

Працює так:

⚫️файли беруться з сервера локально.

⚫️далі розпізнавання фото там же локально на сервері за допомогою vision описової моделі.

⚫️генерація метадати за допомогою RAG АІ агента з Chat GPT та моєю створеною базою гайдів потрібних фотобанків та великим системним промптом. Фактично це окремий агент з базою знань, до якого через чатик можна звертатись при необхідності.

⚫️все це пакується в jpeg та зберігається в гугл драйв.

Ці 34 хв я займався своїм справами, потім отримав оповішення в тг і контент можна завантажувати)

Генерація фоточок робиться теж автоматично іншою системою) на вході я тільки промпти підкидую. Все це вайб кодинг в дії.

По факту ми тепер витрачаємо більше часу на редактування та відбір, ніж на створення та кейвординг.

↗ Оригінал поста в Telegram
Довідка

RAG (Retrieval-Augmented Generation) — Підхід, при якому AI-модель доповнюється зовнішньою базою знань для генерації точніших і контекстних відповідей.

Як автоматизувати прописування метадати для фотостоків?
Можна побудувати пайплайн: vision-модель описує фото локально → GPT-агент з базою гайдів генерує ключові слова → результат записується в JPEG EXIF.
Чи можна замінити людину-кейвордера для Adobe Stock автоматизацією?
Так, GPT RAG-агент, навчений на гайдах конкретного фотобанку, справляється з цим завданням автоматично.

Сподобалось? Це лише один пост. Більше думок про ШІ, технології й творчість — щодня в каналі.

Підписатися в Telegram