6 апреля 2025 · Wiki · мультимодальность

Скрины общения с нашим WikiBot

У нас есть внутренний WikiBot, который обучен только на текстах из нашей Wiki. Там описаны экраны, флоу и немного бизнес‑логики продукта. Никаких специально размеченных датасетов по интерфейсу.

Тем интереснее наблюдать, как он справляется с задачами, где на вход прилетает не текст, а скриншот.

Что умеет WikiBot

На основе одних только текстов он:

угадывает, какой это экран и для чего он нужен;
может подсказать, какой экран будет следующим по сценарию;
даёт ссылки на соответствующие страницы Wiki.

Даже без векторизации изображений такой агент уже помогает команде поддержки, аналитикам и продукту быстрее понимать контекст пользовательских скринов.

Что будет дальше

Следующий шаг — добавить векторизацию реальных скриншотов и связать её с текстовой частью Wiki. Тогда WikiBot сможет не только угадывать экран по описанию, но и находить «похожие» состояния интерфейса по картинке.

Если вам нужен подобный Wiki‑ассистент для вашей команды — оставьте контакты на главной, расскажите про текущий стек (Notion, Confluence, Google Docs и т.д.) и объём базы знаний.