Бұл жазба автоматты түрде аударылған. Бастапқы тіл: Орысша
Бұл менің LinkedIn мақаламның аудармасы
Басты бет қазіргі заманғы ai инвесторларының арманы-автономды ai қызметкері, ол кейбір мамандарды толығымен алмастыра алады және онсыз жұмыс істей алады сыртқы араласу.
Менің ойымша, бұл технологияның қазіргі деңгейімен жүзеге асырылатын қол жетімді мақсат.
Мен әкелемін маған жақын аймақтағы мысал-бағдарламалау (бірақ жалпы қолданыста көптеген digital мамандықтары). Middle backend автономды AI жасайық әзірлеуші.
Біз оны жергілікті серверлік машинада, компанияның контурында жасаймыз.
Бірден мен кодты, параметрлерді немесе workflows-ты жүктемеймін деп айтамын ашық қол жетімділік. Менің мақсатым-жұмысымды жоғары деңгейде көрсету шешім, өйткені мен бос орын емес, мүлдем жоқ екенін көремін мұндай материалдар, тіпті ұқсас беткі деңгеймен мәліметтер.
Бастау үшін бізге қызметкердің толық жұмыс сипаттамасы, мәліметтер қажет, ол білуі керек, ол орындауы керек тапсырмалар, сондай-ақ онымен өзара әрекеттесуге болатын байланыс арналары. Жақсылық қашу өз жемісін берді және бәрі өзара әрекеттесуді үйренді қызметкерлер сандық тәсілдермен.
Біз қол жетімділікті рәсімдейміз-Git-u - SSH кілттері, Confluence және JIRA-API кілттері, telegram, slack үшін таңбалауыштар немесе тағы не (пошта немесе басқа байланыс арналары болсын). Жазу мұның бәрі ерікті JSON конфигурация жұмыс істейтін каталогтағы файл қызметкер (агентті іске қосудың түбірі).
Біз докерді серверге орнатып, n8n, векторлық мәліметтер базасын және PostgreSQL типті реляциялық мәліметтер базасын іске қосамыз .
N8n үшін біз жұмыс каталогына қол жеткіземіз.
Байланыс арналарын конфигурациялаңыз - n8n-де біз қажетті байланыс арналарына триггерлерді қосамыз, осылайша хабарламалар біздің агентке ұшып кетеді және ол жауаптарды қайтара алады. Бірақ біз әдеттегі LLM моделін тартпаймыз, атап айтқанда ілмек немесе реттелетін түйін арқылы жергілікті агентті тартамыз.
Ең қиын бөлігі-агенттің дамуы. Бірақ агенттік деңгейі кейбір курсор көзге жетеді, бастысы-әдіснамалық дұрыс өнеркәсіп.
Тағы бір маңызды қадам MCP денелерін орнату агент үшін-ақпаратты іздеу және скрапинг, JIRA, Confluence, Git-пен жұмыс және т. б. біздің AI қызметкерінің қолдары мен көздері болуы үшін.
Сондай-ақ сияқты маңызды нәрселерді есте сақтау үшін RAG механизмі қажет осы түрдегі мәселені дұрыс шешу немесе оны қалай дұрыс табу керек ақпарат. Агенттің өзі қарапайым өнеркәсіп арқылы нақты не шеше алады түрі:
оларды есте сақтау үшін ағымдағы сессиядан маңызды сәтті шешімдерді бөлектеңіз
Бұл біздің AI қызметкеріміз тәжірибе жинақтауы үшін қажет. Реляциялық мәліметтер базасы "мінез-құлық ережелерін" жинақтау үшін қажет, егер менеджер бір нәрсеге риза болмаса және "енді олай жасамаңыз" немесе керісінше "осылай жасаңыз"десе.
Жұмыстың ең маңызды және мүмкін көлемді бөлігі - рәсімдеу біздің қызметкердің жұмыс әдіснамасы (жақсы жағынан бәрі керек Job Description-да сипатталуы керек).
Жұмыс 2 кезеңге бөлінеді
- RAG-А-ны маңызды біліммен толтыру. Шамамен айтқанда, біз Rag-ге онбоардинг процесін енгіземіз.
- кесте параметрі-n8n-де біз Cron триггерлерін орнатамыз, мысалы, таңғы 9-да Jira-ға кіріп, маған тағайындалған жаңа тасбақаларды көріңіз, талдаңыз және іске қосуды бастаңыз немесе түсініктемелерде жазылудан бас тартыңыз.
Біздің ai middle әзірлеушісінің мысалын талдайық:
- Кесте бойынша Jira-ға кіріп, сүйреткіштерін тартады.
- Егер бірдеңе жетіспесе, тасканы толықтығы мен орындылығын тексереді-түсініктемелерде хабарлайды.
- Қажетті ортаны тексереді - желі арқылы кіру, кодқа қол жеткізу, Git-пен жұмыс істеу мүмкіндігі және т. б.
- Тапсырманы орындайды. Қалыпты сипаттамамен курсор қазірдің өзінде Мен үшін middle әзірлеуші деңгейіндегі тапсырмалардың 100% жабады (егер сізде жоқ болса, онда контексттің толықтығы немесе өндірістік сапа зардап шегеді).
- Кейбір Playwright MCP немесе Postman көмегімен жергілікті тестілеу.
- Нәтижені бикешке құйып, деплойдың құбыр желісін тексереді.
- Егер қателер болса, түсініктемелерде жазбайды, девопсқа жаза алады, тасканы басқа қадамға айналдырады.
- Егер бәрі қатесіз болса, бикешті қайтадан тексереді.
- Тасканы жылжытады, түсініктемелерде, топта немесе басқа жерде жазылмайды (байланыс арналары мен әдіснамасы қалай орнатылды).
- Дейликтердің орнына Jira-дан кешегі тасбақалар туралы ақпаратты, git-тен осы тасбақалар үшін өзгерістер туралы ақпаратты жинап, есеп жібере алады. Сондай-ақ, ол мөрленген таспа туралы және неге бұлай болғанын хабарлауы мүмкін.
- Telegram, slack және басқа байланыс арналарындағы хабарламаларға жауап бере алады.
- Тіпті тәжірибе туралы естеліктер мен кодты зерттеу негізінде джунамға немесе тестерлерге шешімдер ұсына алады.
Негізінде, барлығы, қазіргі кезеңде бұл өте сенімді және сапалы middle әзірлеушісі нарықтағы орташа деңгейден жақсы.
Әрине, көп нәрсе агент қолданатын модельге байланысты, бірақ ешкім жоқ жақсы коэффициенттерді іздеу арқылы әртүрлі нұсқаларды тексеруге кедергі келтіреді сапа / баға / жылдамдық.
Модельдің әр түрлі мінез-құлқын ескеру үшін жұмыс әдіснамасын жасау өте маңызды.
Жоқ агентті циклден немесе күтімнен қорғау механизмдері туралы ұмытып кету керек шексіз мағынасыз пайымдау. Бірақ егер агент жақсы жұмыс істесе, ол қазірдің өзінде бар.
Бұл жалған архитектура болса да, мен жергілікті сипатталған көптеген заттарды іске қоса аламын.
Мұның бәрі, назар аударғаныңыз үшін рахмет.
Это перевод моей статьи в LinkedIn
Главная мечта современных инвесторов в ИИ - это автономный ИИ сотрудник, который может полностью заменить некоторых специалистов и работать без постороннего вмешательства.
На мой взгляд это уже вполне достижимая цель, которая реализуема с текущим уровнем технологий.
Приведу пример на близкой мне области - программирование (но вообще применим к большинству digital профессий). Сделаем автономного ИИ middle backend разработчика.
Сделаем мы его на локальной серверной машине, внутри контура компании.
Сразу скажу что Я не буду выкладывать свой код, настройки или workflows для открытого доступа. Моя цель - верхнеуровнево показать рабочее для меня решение, потому что вижу не то что пробел, а вообще отсутствие материалов такого рода, даже с подобным поверхностным уровнем детализации.
Подготовка
Для начала нам понадобится полный Job Description сотрудника, данные, которые ему необходимо знать, задачи, которые ему необходимо выполнять, а также каналы связи по которым с ним можно взаимодействовать. Благо удаленка дала свои плоды и все научились взаимодействовать с сотрудниками цифровыми способами.
Формализуем доступы - к Git-у - ssh ключи, к Confluence и Jira - API ключи, токены для telegram, slack или что ещё (будь то почта или любые другие каналы связи). Записываем всё это в произвольный json конфиг файл в директории где будет работать сотрудник (корень запуска агента).
Установим докер на сервер и там запустим n8n, векторную БД и какую-нибудь реляционную БД типа PostgreSQL .
Для n8n дадим доступ к рабочей директории.
Настройка
Настроим каналы связи - в n8n добавим триггеры на нужные каналы связи, чтобы сообщения улетали в нашего агента и он мог возвращать ответы. Но дергать мы будем не обычную LLM модель, а именно через хук или кастомную ноду дергать локального агента.
Агент
Самая сложная часть это разработка агента. Но уровня агентности какого-нибудь Cursor хватает за глаза, главное сделать методологически правильные промпты.
Ещё один важный шаг это настройка MCP тулов для агента - поиск и скрапинг информации, работа с Jira, Confluence, Git и т.д. Чтобы у нашего ИИ сотрудника были руки и глаза.
Также обязательно нужен механизм RAG для мемоизации важных вещей типа как правильно решить задачу такого вида или как правильно найти такую то информацию. Что именно важно может решить сам агент простым промптом типа:
выдели важные успешные решения из текущей сессии для их запоминания
Это нужно чтобы наш ИИ сотрудник накапливал опыт. Реляционная база данных нужна для накопления "правил поведения", когда руководитель чем то не доволен и говорит "так больше не делай", или наоборот "делай вот так".
Методология
Самая важная и, скорее всего, объемная часть работы - формализовать методологию работы нашего сотрудника (по хорошему это всё уже должно быть описано в Job Description).
Делится работа на 2 этапа
- наполнение RAG-а важными знаниями. Грубо говоря засовываем в RAG процесс онбоардинга.
- настройка расписания - в n8n настраиваем cron триггеры, допустим в 9 утра зайти в Jira и посмотреть новые таски, назначенные для меня, проанализировать и либо начать выполнение, либо отписаться в комментариях.
Как это всё работает
Разберем на примере нашего ИИ middle разработчика:
- Заходит по расписанию в Jira, стягивает свои таски.
- Проверяет таску на полноту и выполнимость, если чего-то не хватает - сообщает в комментариях.
- Проверяет необходимое окружение - доступ по сети, доступ к коду, возможность работы с Git и т.д.
- Выполняет задачу. С нормальным описанием Cursor уже сейчас для меня закрывает 100% задач уровня middle разработчика (если у Вас нет, значит либо страдает полнота контекста, либо качество промпта).
- Тестирует локально с помощью какого-нибудь Playwright MCP или Postman.
- Заливает результат в дев, проверяет пайплайн деплоя.
- Если ошибки, отписывает в комментариях, может написать девопсу, откатывает таску на другой шаг.
- Если всё без ошибок, снова проверяет на деве.
- Двигает таску, отписывается в комментариях, группе или где ещё (как настроили каналы связи и методологию).
- Вместо дейликов, может собрать с Jira информацию о вчерашних тасках, с Git-а об изменениях для этих тасок и отправить отчет. Также может сообщить о зафейленных тасках и почему так получилось.
- Может отвечать на сообщения в telegram, slack и других каналах связи.
- Даже может на основе мемоизации опыта и исследовании кода подсказывать решения джунам или тестировщикам.
В принципе всё, на текущем этапе это уже довольно надежный и качественный middle разработчик лучше среднего по рынку.
Заключение
Конечно многое зависит от используемой агентом модели, но никто не мешает тестировать разные варианты, подыскивая хорошее соотношения качества/цены/скорости.
Также очень важно проработать методологию работы, чтобы учитывать разные варианты поведения модели.
Не стоит забывать о механизмах защиты агента от зацикливания или ухода в бесконечные бессмысленные рассуждения. Но если агент хорошо проработан, там это уже есть.
Хоть это и псевдо архитектура, у меня уже получается запускать локально многие описанные вещи.
На этом всё, спасибо за внимание.