«Перечитати» 20 відео за 30 хвилин: українець створив бота для стислого переказу YouTube-роликів. Як працює YTSummarAI?
Senior Backend Developer Олександр Диптан створив Telegram-бота YTSummarAI, щоб розв’язати проблему надмірного споживання контенту та браку часу на перегляд довгих відео. Тепер розробник може «перечитати» до 20 відео за день усього за 30 хвилин.
Залишити коментар
Senior Backend Developer Олександр Диптан створив Telegram-бота YTSummarAI, щоб розв’язати проблему надмірного споживання контенту та браку часу на перегляд довгих відео. Тепер розробник може «перечитати» до 20 відео за день усього за 30 хвилин.
«Мені потрібен був не „інструмент для підсумків відео“, а „система легкого засвоєння і фільтрації інформації“ — повний ланцюжок від появи нового ролика до готового підсумку в одному місці», — наголосив Олександр Диптан у блозі на DOU.
Технічна «начинка»
Маючи досвід з Telegram-ботами, розробник обрав цю платформу як оптимальне рішення для швидкого запуску MVP. Такий вибір дозволив закрити базові потреби продукту, адже Telegram вже має готову авторизацію, мобільну та десктопну версії, систему прийому платежів та можливості для глибокої кастомізації через WebApp.
Щоб забезпечити стабільність системи під навантаженням, розробник із першого дня застосував event-driven підхід: бот лише приймає запити та реєструє їх як асинхронні повідомлення в Redis, тоді як вся важка обробка виконується окремими воркерами у фоновому режимі.
Технологічний стек проєкту базується на Symfony 7+, PostgreSQL та Redis, де Symfony Messenger виступає у ролі брокера повідомлень. Уся інфраструктура розгорнута в Docker на одному VPS, що дозволяє легко масштабувати потужність шляхом додавання нових сервіс-контейнерів.
Як працює бот
Робота YTSummarAI побудована на повній автоматизації та інтелектуальній обробці контенту, що дозволяє користувачеві отримувати готові підсумки відео без зайвих зусиль.
Процес починається з RSS-поллера, який постійно моніторить обрані YouTube-канали на предмет нових релізів. Щойно з’являється відео, система автоматично створює завдання в черзі Redis, яке підхоплює воркер для витягування транскрипту та подальшого аналізу штучним інтелектом.
Користувач взаємодіє з ботом через зручний інтерфейс із картками прев’ю: якщо підсумок уже готовий, його можна прочитати миттєво, а якщо ні — запустити процес натисканням кнопки, що видасть результат протягом 30 секунд.
«Кілер-фічею» проєкту, на думку розробника, є використання персоналізованих промптів для кожного окремого каналу. При підписці на канал ШІ аналізує останні 15 відео, щоб адаптувати стиль резюме під специфіку контенту. Це дозволяє, наприклад, у фінансових відео фокусуватися на тікерах та цільових цінах, а в історичних — на причинно-наслідкових зв’язках та контексті епохи.
Технічно найскладнішим етапом залишається отримання транскриптів, оскільки YouTube не має офіційного API для субтитрів. Наразі проблему вирішено через ланцюжок із двох платних провайдерів, які забезпечують стабільну роботу в обхід лімітів та технічних змін платформи, проте в майбутньому розробник планує перейти на власне рішення для повної незалежності.
Персональна бібліотека знань
Попри значну економію часу на перегляді контенту, виникла інша проблема: складність повернення до отриманих інсайтів. Список «Переглянути пізніше» фактично просто перемістився з YouTube у Telegram, перетворившись на хаотичну лінійну стрічку повідомлень без папок чи структури.
Щоб уникнути ситуації, коли потрібна інформація губиться, розробник впровадив систему тегів, які користувач може ставити прямо у формі підсумку. У меню WebApp з’явилася нова вкладка «Теги» з двома режимами перегляду: загальною хмарою тегів, відсортованих за назвою, та хронологічним списком відео за обраним запитом.
Технічно це реалізовано через окрему таблицю з унікальними ключами для кожного користувача, відео та назви тегу. Для зручності інтерфейс підтримує автодоповнення та просте керування inline-тегами за допомогою клавіші Enter або швидкого видалення.
«Це просто, але ефект на моє власне бачення дуже великий. Я перестав ставитись до бота як до „інструменту швидкого читання YouTube“. Він став персональною бібліотекою знань. Я не споживаю — я накопичую. Я не „дивлюсь відео“ — я будую базу. І ця база інтуїтивно структурується самим процесом тегування, без зайвої роботи в окремому застосунку», — зауважив Олександр Диптан.
Крім того, за два тижні розробник додав кілька оновлень. По-перше, було реалізовано систему сповіщень про готовність підсумку безпосередньо в чат бота. Якщо раніше користувач міг закрити WebApp під час обробки запиту й просто забути про нього, то тепер бот автоматично надсилає повідомлення, щойно штучний інтелект завершує роботу над саммарі.
По-друге, з’явилася функція створення публічних share-сторінок для кожного підсумку. Це дозволяє користувачам легко ділитися знайденими інсайтами з друзями через структуровані посилання. Окрім зручності для користувачів, такі сторінки з налаштованими sitemap та розміткою JSON-LD стають каналом для залучення органічного трафіку з Google, а система перелінковки за схожими тегами допомагає утримувати відвідувачів на платформі.
Про плани
У планах Олександра Диптана — вийти за межі YouTube. Також розробник працює за кількома напрямами: автотеги за допомогою AI, підписка через Paddle, повнотекстовий пошук у бібліотеці та чат-бот для відео.
Залишити коментарСхожі новини
‘Monarch: Legacy of Monsters’ loses its human touch in sprawling second season
EU reaches tentative deal on simpler AI rules, plans ban on 'nudifier' apps
BioNTech: From COVID vaccine pioneer to uncertain future