Публикация была переведена автоматически. Исходный язык: Русский
С детства люблю две вещи: читать и небольшие прикладные исследования. В этой статье я покажу простой метод разбора наших литературных вкусов с помощью ИИ. Почему нам нравятся эти книги? Что в них такого для нас? ИИ может рассказать нам много чего о нас самих. Расскажу пошагово. Итак.
Шаг 1.
Давайте возьмём список из 30 книг в формате [Название, Автор]. которые нам зашли, и с помощью некоторых манипуляций с нейросетью попробуем понять самих себя. Искусственный интеллект становится мощным инструментом для самоисследования. Почему доверить ИИ анализ рентгеновских снимков нашей грудины - нормально, а вот анализ наших литературных предпочтений - не нормально? Уменьшит ли это наше наслаждение искусством? Нет. Это добавит к наслаждению новый, интеллектуальный слой. Чем больше будет в нашем списке книг, тем лучше. Я, как человек ленивый, просто отфотографировал титульные листы моих любимых книг и потом озадачил ИИ распознанием текста и составлением списка. Разумеется, потом всё верифицировал вручную.
Шаг 2.
Дальше нас имеется два пути. Первый - сделать всё по уму, с помощью семантического анализа. Например, получить подробные описания каждой из книг, преобразовать эти описания в векторные представления, уменьшить размерность с помощью UMAP, затем с помощью HDBSCAN выделить кластеры... Это будет круто, воспроизводимо и прозрачно. Но несколько сложновато для такой задачи. Лучше сделаем всё "в лоб", вторым, более простым способом. Мы создадим текстовые описания к каждой из этих книг с помощью ИИ.
Примерный промпт для создания описаний к книгам:
«Для каждой книги из списка ниже создай краткое описание по следующему шаблону:
1.Название
2. Суть: История о [род занятий/тип персонажа протагониста],
который [ключевое действие/конфликт]
в условиях [сеттинг/антураж].
3.Ключевые темы (3-5 ключевых тем)
4.Тон/стиль повествования
Если описание к какой-либо книге не найдено, не выдумывай его, а заяви об этом прямо.
Все описания упакуй в один файл в виде структурированного JSON.
Список книг {тут ваш список книг}
Полученный JSON-файл и будет опорой для дальнейшей работы. Однако, есть нюансы, не позволяющие создать единый пайплэйн, в начале которого - список книг, а в конце - подробный анализ наших литературных предпочтений. К примеру, описание к некоторым книгам нейросеть упорно не хочет искать. Считает их редкими или несуществующими. Можно попробовать их отыскать вручную, а затем добавить информацию в общий файл. Разумеется, если наши книги общеизвестны, тут проблем не будет. А вот если ИИ и вручную не сможет найти описания к ним, проще заменить их на какие-то другие, тоже понравившиеся. Это уже детали. Я лишь описываю сам подход и этапы.
Шаг 3.
Загрузим JSON-файл обратно в нейросеть и попросим подтянуть уже имеющуюся информацию по каждой из книг, сверяясь с описанием из списка, затем сгруппировать книги по группам, а затем попросить ИИ объяснить, что их объединяет в каждой группе, и сделать общий вывод, какие именно герои и сюжеты нам нравятся, и что для нас важно в этих книгах.
Примерный вариант промпта:
--------------------------------
Роль: эксперт по литературному анализу и паттерн-распознаванию. Задача - анализировать читательские предпочтения на основе описаний его любимых книг. Опирайся на имеющуюся информацию об этих книгах из доступных тебе источников, при этом сверяйся с описанием соответствующей книги, предоставленным пользователем.
Входные данные {наш JSON-файл со списком книг и аннотациями к ним}
Инструкции:
1. Сгруппируй книги в 3–5 логических категорий на основе общих черт:
-тип героя (например: «недооценённый новичок», «уставший спаситель», «исследователь-одиночка»),
-природа конфликта (внутренний, этический, выживание, поиск смысла),
-тональность (например, надежда, меланхолия, напряжение, тёплая ностальгия).
Учитывай, что некоторые книги могут не входить ни в одну из групп. Не учитывай их при создании общего вывода.
2. Для каждой группы:
-Назови группу ёмким, содержательным заголовком (не «Группа 1»);
-Перечисли книги в группе;
-Объясни 1-2 предложениями, что их объединяет. Укажи психологическое или эмоциональное сходство.
3. Сделай общий вывод (3–4 предложения):
-Какие типы героев вас привлекают?
-Какие сюжеты повторяются?
-Что важнее всего в этих книгах для вас лично? (например: «вам важно, чтобы слабость героя становилась источником силы»).
Запрещено:
-Придумывать описания книг, которых нет во входных данных;
-Использовать общие фразы вроде «книги о добре и зле» — только конкретика;
-Делать выводы, не вытекающие напрямую из текстов.
Пример формата для вывода:
[Заголовок группы 1]
• Книга А
• Книга В
Что объединяет: [объяснение]
[Заголовок группы 2]
• Книга Б
• Книга Г
Что объединяет: [объяснение]
[Общий вывод]
-----------------------
Всё, теперь можем наслаждаться результатом.
Какие же инсайты это даёт на практике?
• Осознанный поиск книг для чтения: Теперь мы можем искать не просто похожее на какую-то нашу любимую книгу, а, например, книгу про героев, которые погружены в сложные, абсурдные или враждебные системы. В основе описания лежит всё тот же паттерн.
• Понимание себя: предпочтения в развлечениях — это на самом деле про ценности, страхи и внутренние конфликты. Например, нас увлекает постапокалипсис. Возможно, это способ прожить тревогу о будущем в безопасном формате (на самом деле, это так и есть).
• Прыжок в новое: чётко определив свой паттерн, можно сознательно выбрать что-то с противоположными параметрами. Если наша библиотека — это сплошные интроверты-мыслители, давайте хотя бы разок возьмём книгу про харизматичного деятеля.
Важные предостережения
ИИ - это всего лишь имитация когнитивного поведения. От запроса к запросу результат будет плавать (и это нормально). Поэтому всегда помним, что ИИ хорош как инструмент для генерации гипотез. Не более, но и не менее. Интерпретировать результаты должны мы сами.
И ещё кое-что. Если захотите поэкспериментировать со своими дневниками или личными записями, трижды подумайте, выгружать ли их в публичные модели. Лично я бы не стал этого делать. Лучше использовать локальные LLM.
А теперь изюминка метода
Она, скорее, психологическая, чем техническая. Единичный анализ может позабавить, развлечь и заставить немного порефлексировать. Ну, и всё. А вот если мы сравним, например, наши любимые книги детства или юности, и наши теперешние книги, тут уже есть над чем поразмышлять всерьёз. Как мы изменились, как выросли? Выросли ли? За счет чего произошли эти изменения? В конечном счёте, здесь нас интересует только один главный герой - мы сами.
С детства люблю две вещи: читать и небольшие прикладные исследования. В этой статье я покажу простой метод разбора наших литературных вкусов с помощью ИИ. Почему нам нравятся эти книги? Что в них такого для нас? ИИ может рассказать нам много чего о нас самих. Расскажу пошагово. Итак.
Шаг 1.
Давайте возьмём список из 30 книг в формате [Название, Автор]. которые нам зашли, и с помощью некоторых манипуляций с нейросетью попробуем понять самих себя. Искусственный интеллект становится мощным инструментом для самоисследования. Почему доверить ИИ анализ рентгеновских снимков нашей грудины - нормально, а вот анализ наших литературных предпочтений - не нормально? Уменьшит ли это наше наслаждение искусством? Нет. Это добавит к наслаждению новый, интеллектуальный слой. Чем больше будет в нашем списке книг, тем лучше. Я, как человек ленивый, просто отфотографировал титульные листы моих любимых книг и потом озадачил ИИ распознанием текста и составлением списка. Разумеется, потом всё верифицировал вручную.
Шаг 2.
Дальше нас имеется два пути. Первый - сделать всё по уму, с помощью семантического анализа. Например, получить подробные описания каждой из книг, преобразовать эти описания в векторные представления, уменьшить размерность с помощью UMAP, затем с помощью HDBSCAN выделить кластеры... Это будет круто, воспроизводимо и прозрачно. Но несколько сложновато для такой задачи. Лучше сделаем всё "в лоб", вторым, более простым способом. Мы создадим текстовые описания к каждой из этих книг с помощью ИИ.
Примерный промпт для создания описаний к книгам:
«Для каждой книги из списка ниже создай краткое описание по следующему шаблону:
1.Название
2. Суть: История о [род занятий/тип персонажа протагониста],
который [ключевое действие/конфликт]
в условиях [сеттинг/антураж].
3.Ключевые темы (3-5 ключевых тем)
4.Тон/стиль повествования
Если описание к какой-либо книге не найдено, не выдумывай его, а заяви об этом прямо.
Все описания упакуй в один файл в виде структурированного JSON.
Список книг {тут ваш список книг}
Полученный JSON-файл и будет опорой для дальнейшей работы. Однако, есть нюансы, не позволяющие создать единый пайплэйн, в начале которого - список книг, а в конце - подробный анализ наших литературных предпочтений. К примеру, описание к некоторым книгам нейросеть упорно не хочет искать. Считает их редкими или несуществующими. Можно попробовать их отыскать вручную, а затем добавить информацию в общий файл. Разумеется, если наши книги общеизвестны, тут проблем не будет. А вот если ИИ и вручную не сможет найти описания к ним, проще заменить их на какие-то другие, тоже понравившиеся. Это уже детали. Я лишь описываю сам подход и этапы.
Шаг 3.
Загрузим JSON-файл обратно в нейросеть и попросим подтянуть уже имеющуюся информацию по каждой из книг, сверяясь с описанием из списка, затем сгруппировать книги по группам, а затем попросить ИИ объяснить, что их объединяет в каждой группе, и сделать общий вывод, какие именно герои и сюжеты нам нравятся, и что для нас важно в этих книгах.
Примерный вариант промпта:
--------------------------------
Роль: эксперт по литературному анализу и паттерн-распознаванию. Задача - анализировать читательские предпочтения на основе описаний его любимых книг. Опирайся на имеющуюся информацию об этих книгах из доступных тебе источников, при этом сверяйся с описанием соответствующей книги, предоставленным пользователем.
Входные данные {наш JSON-файл со списком книг и аннотациями к ним}
Инструкции:
1. Сгруппируй книги в 3–5 логических категорий на основе общих черт:
-тип героя (например: «недооценённый новичок», «уставший спаситель», «исследователь-одиночка»),
-природа конфликта (внутренний, этический, выживание, поиск смысла),
-тональность (например, надежда, меланхолия, напряжение, тёплая ностальгия).
Учитывай, что некоторые книги могут не входить ни в одну из групп. Не учитывай их при создании общего вывода.
2. Для каждой группы:
-Назови группу ёмким, содержательным заголовком (не «Группа 1»);
-Перечисли книги в группе;
-Объясни 1-2 предложениями, что их объединяет. Укажи психологическое или эмоциональное сходство.
3. Сделай общий вывод (3–4 предложения):
-Какие типы героев вас привлекают?
-Какие сюжеты повторяются?
-Что важнее всего в этих книгах для вас лично? (например: «вам важно, чтобы слабость героя становилась источником силы»).
Запрещено:
-Придумывать описания книг, которых нет во входных данных;
-Использовать общие фразы вроде «книги о добре и зле» — только конкретика;
-Делать выводы, не вытекающие напрямую из текстов.
Пример формата для вывода:
[Заголовок группы 1]
• Книга А
• Книга В
Что объединяет: [объяснение]
[Заголовок группы 2]
• Книга Б
• Книга Г
Что объединяет: [объяснение]
[Общий вывод]
-----------------------
Всё, теперь можем наслаждаться результатом.
Какие же инсайты это даёт на практике?
• Осознанный поиск книг для чтения: Теперь мы можем искать не просто похожее на какую-то нашу любимую книгу, а, например, книгу про героев, которые погружены в сложные, абсурдные или враждебные системы. В основе описания лежит всё тот же паттерн.
• Понимание себя: предпочтения в развлечениях — это на самом деле про ценности, страхи и внутренние конфликты. Например, нас увлекает постапокалипсис. Возможно, это способ прожить тревогу о будущем в безопасном формате (на самом деле, это так и есть).
• Прыжок в новое: чётко определив свой паттерн, можно сознательно выбрать что-то с противоположными параметрами. Если наша библиотека — это сплошные интроверты-мыслители, давайте хотя бы разок возьмём книгу про харизматичного деятеля.
Важные предостережения
ИИ - это всего лишь имитация когнитивного поведения. От запроса к запросу результат будет плавать (и это нормально). Поэтому всегда помним, что ИИ хорош как инструмент для генерации гипотез. Не более, но и не менее. Интерпретировать результаты должны мы сами.
И ещё кое-что. Если захотите поэкспериментировать со своими дневниками или личными записями, трижды подумайте, выгружать ли их в публичные модели. Лично я бы не стал этого делать. Лучше использовать локальные LLM.
А теперь изюминка метода
Она, скорее, психологическая, чем техническая. Единичный анализ может позабавить, развлечь и заставить немного порефлексировать. Ну, и всё. А вот если мы сравним, например, наши любимые книги детства или юности, и наши теперешние книги, тут уже есть над чем поразмышлять всерьёз. Как мы изменились, как выросли? Выросли ли? За счет чего произошли эти изменения? В конечном счёте, здесь нас интересует только один главный герой - мы сами.