[Великий невеликий] Выходцы из OpenAI представили чат-бота, который умеет обрабатывать огромные тексты — на «Великий Гэтсби» ушло меньше минуты
![[Великий невеликий] Выходцы из OpenAI представили чат-бота, который умеет обрабатывать огромные тексты — на «Великий Гэтсби» ушло меньше минуты](/story_images/662000/1684137111_56_1684137086_64_1684136479_36_1684136402_93_1684136352_58_1684136274_46_1684136199_98_generated.jpg)
Стартап Anthropic смог расширить контекстное окно ввода своего чат-бота Claude до 75 000 слов — это большое улучшение по сравнению с текущими моделями. Компания заявляет, что чат-бот может обработать целый художественный роман менее чем за минуту.
Часто упускаемое из виду ограничение для чат-ботов — это память. Хотя языковые модели ИИ, лежащие в основе этих систем, действительно обучаются на терабайтах текста, объем, который эти системы могут обработать во время использования, весьма ограничен. Для ChatGPT это около 3000 слов. И хотя существуют способы обхода этих ограничений, однако этого все равно мало. Компания Anthropic, основанная бывшими инженерами OpenAI, значительно расширила контекстное окно для своего чат-бота Claude, доведя его до 75 000 слов. Как она отмечает в своём блоге, этого достаточно, чтобы обработать произведение «Великий Гэтсби» за один раз. Фактически, компания протестировала систему, отредактировав одно предложение в романе и попросив ИИ заметить изменение. Это произошло за 22 секунды.
Языковые модели ИИ измеряют информацию не количеством символов или слов, а токенами – семантической единицей, которая не всегда коррелируется с количеством символов, а так как слова могут быть длинными или короткими, их длина не обязательно соответствует количеству токенов. В этом отношении контекстное окно Claude превосходит модель OpenAI, так как может оперировать 100 000 токенам по сравнению с 9 000 ранее, в то время как полнофункциональная модель GPT-4 с может обрабатывать до 32 000 токенов.
Сейчас новые возможности Claude доступны только бизнес-партнёрам Anthropic, которые подключаются к чат-боту через API компании. Цена также неизвестна, но она наверняка значительно выросла, так как обработка большего количества текста означает увеличение затрат на вычисления.
Источник:
