«Мені ІТ саласына Dota 2-ге деген махаббат алып келді»
— Өзіңіз жайлы айтып беріңізші: қай жерде өстіңіз, ІТ-ге қалай келдіңіз?
— Мен Тәжікстанның солтүстігіндегі Худжанд қаласында дүниеге келдім. 18 жасымда Ресейдің «Жоғары экономика мектебі» университетіне оқуға түстім. Мамандығым — экономист. Бірақ екінші курста қосымша ІТ бағытын таңдадым. Бұл салаға келуіме, шын мәнінде, Dota 2 ойыны түрткі болды деуге болады. Бір күні университетте Data Science мамандығын таныстырды. Мысал ретінде сол ойынды алып, заттар арасындағы байланыс графтарын, ойыншылар арасындағы транзакцияларды көрсетіп берді. Сол кезде қатты әсер алдым. Осылайша деректер ғылымын оқуға кірістім.
— zypl.ai-ға келмес бұрын қай жерде жұмыс істедіңіз?
— Университетті бітірген соң Ernst & Young компаниясына аудитор болып жұмысқа тұрдым. Кейін Oliver Wyman консалтинг компаниясына ауыстым. Онда ашық деректер негізінде шағын және орта бизнеске арналған скоринг жүйесін жасаумен айналысатын ішкі шағын стартап болды. Сол жерде алғаш рет қаржы саласындағы машиналық оқытумен тереңірек таныстым, заңды тұлғаның салық идентификаторы бойынша тәуекелдерді бағалап, компанияның төлем қабілетін болжай алатын модельдер құрдық.
Бірнеше басқа компанияда да істедім, бір кезде өз ісім туралы ойлай бастадым. Сол шамада Азизжон Азимимен таныстым. Бір күні ол сторисіне zypl.ai-да өнім жөніндегі жетекші керек екенін жазды, бизнес пен технологияны қатар түсінетін, өнім мен әзірлеу тобын басқаратын адам іздеп жатыр екен.
Оны көріп, «мен бұл орынға сай келетін сияқтымын» деп ойладым. Азизжонға жазып, сөйлесейік дедім. Сөйлестік, сөйтіп кейін командаға қосылдым.
— Ол кезде компания немен айналысып жатқан еді?
— Сол кезде стартаптың құрылғанына екі жылдай болған. zypl.ai идеясы Азизжонның Стэнфордта оқып жүрген кезінде пайда болған, ол сол кезде жасанды интеллект арқылы несие тәуекелін бағалайтын платформа концепциясын ойлап тапқан. Кейін Тәжікстанға оралғанда мұндай жобаны жүзеге асыра алатын мамандардың жоқтығын түсінген. Сол себепті инженерлер мен дата-сайентистерді дайындайтын AI академиясын құрды. Академия әлі де жұмыс істейді, ал оның түлектерінен zypl.ai-дың алғашқы командасы қалыптасты.
Бастапқыда компания банктердің әлеуетті клиенттерінің төлем қабілетін бағалау — скоринг технологиясына басымдық берді. Мысалы, адам қосымша арқылы несиеге өтініш бергенде, жүйе оның деректерін талдап, бірнеше секунд ішінде несиені мақұлдау, не бас тарту туралы шешім шығарады. Біз осындай алгоритмдерді — деректерді өңдеп, шешім шығаратын технологияларды жасаумен айналыстық.
«Қайтарылмаған несиелердің үлесін 30%-ға азайтамыз»
— Сіз келгеннен кейін zypl.ai-да не өзгерді?
— Мен қосылған кезде құрылым кәдімгі стартаптағыдай болатын, яғни нақты процестер мен рөлдер анықталмаған. Тіпті әркім өзіне ыңғайлы технологиялық стекпен жұмыс істейтін. Алдымен, осының бәрін реттедім: команданы бағыттар бойынша бөлдім, жауапкершілік аймақтарын нақтыладым және өнімдік roadmap енгіздім (яғни, команда қандай өнімді қашан әзірлейтінін көрсететін құжат немесе визуалды жоспар — Digital Business еск.).
Бұл қадам жүйесіз әрекеттен арылып, негізгі өнімдерге — ең алдымен, синтетикалық деректерді генерациялайтын zGAN технологиясы мен техникалық білімі жоқ мамандарға ML-модельдер құруға мүмкіндік беретін Lucid платформасына назар аударуға жағдай жасады.
— zGAN не үшін қажет екенін қарапайым тілмен түсіндіріп беріңізші.
— Мысалы, шағын банк бар делік. Күн сайын қызметкерлерге кімге несие беріп, кімге бас тарту керектігін шешуге тура келеді. Мұны қолмен немесе қарапайым ережелермен, мысалы, «егер табысы $1000-нан аз болса — бас тарту» қағидатымен істеу дәл емес, әрі қауіпті. Сондықтан банктер жүздеген көрсеткішті талдап, адамның несиені қайтара ала ма, жоқ па, соны болжайтын машиналық оқыту модельдерін пайдаланады.
Бірақ мұндай модельдің дұрыс жұмыс істеуі үшін көп, әрі сапалы деректер қажет. Ал шағын банктерде ондай деректер жоқ: клиент аз, несиелердің тарихы да жеткіліксіз. Біз осы мәселені шешеміз: біздің құрал жетіспейтін деректерді синтетикалық түрде толықтырып, модельді банк көп деректерге ие секілді етіп үйретуге мүмкіндік береді. Соның арқасында модель кім несиені қайтарады, ал кім қайтара алмауы мүмкін екенін дәлірек анықтайды.
— Ал ірі банктерге ше? Оларда деректер жетіспеу проблемасы жоқ қой.
— Иә, бірақ синтетикалық деректер тек жетіспейтінді толықтыру үшін емес, шынайы деректермен араластырып қолдануға да болады, бұл модельдің тұрақтылығын арттырады. zGAN сирек кездесетін немесе әлі болмаған макроэкономикалық сценарийлерді, мысалы, инфляцияның күрт өсуі немесе шикізат нарығының құлдырауы сияқты жағдайларды имитациялайтын «аномалды» деректерді де жасай алады.
Бірден айтайын, біз нақты жағдайларды, мысалы COVID-19 сияқты оқиғаларды болжай алмаймыз, бірақ соған ұқсас сценарийлерді жасап, модельге осындай ауытқулар болуы мүмкін екенін және оларға қалай жауап беру керектігін үйретеміз.
Егер ертең экономикалық құлдырау, валютаның әлсіреуі немесе жұмыссыздық белең алса, модель скорингте қателікке көп ұрынбайды, өйткені ол осындай жағдайларды оқыту кезінде «көріп» үйренген.
Кәдімгі модельдердің дәлдігі ай сайын өзгеріп тұруы мүмкін: бірде 95%, бірде 70%. Ал синтетикалық стресс-сценарийлермен үйретілген модельдің нәтижесі тұрақты, бұл реттеушілер үшін өте маңызды.
Толығырақ Digitalbusiness.kz сайтынан оқи аласыздар.
«Мені ІТ саласына Dota 2-ге деген махаббат алып келді»
— Өзіңіз жайлы айтып беріңізші: қай жерде өстіңіз, ІТ-ге қалай келдіңіз?
— Мен Тәжікстанның солтүстігіндегі Худжанд қаласында дүниеге келдім. 18 жасымда Ресейдің «Жоғары экономика мектебі» университетіне оқуға түстім. Мамандығым — экономист. Бірақ екінші курста қосымша ІТ бағытын таңдадым. Бұл салаға келуіме, шын мәнінде, Dota 2 ойыны түрткі болды деуге болады. Бір күні университетте Data Science мамандығын таныстырды. Мысал ретінде сол ойынды алып, заттар арасындағы байланыс графтарын, ойыншылар арасындағы транзакцияларды көрсетіп берді. Сол кезде қатты әсер алдым. Осылайша деректер ғылымын оқуға кірістім.
— zypl.ai-ға келмес бұрын қай жерде жұмыс істедіңіз?
— Университетті бітірген соң Ernst & Young компаниясына аудитор болып жұмысқа тұрдым. Кейін Oliver Wyman консалтинг компаниясына ауыстым. Онда ашық деректер негізінде шағын және орта бизнеске арналған скоринг жүйесін жасаумен айналысатын ішкі шағын стартап болды. Сол жерде алғаш рет қаржы саласындағы машиналық оқытумен тереңірек таныстым, заңды тұлғаның салық идентификаторы бойынша тәуекелдерді бағалап, компанияның төлем қабілетін болжай алатын модельдер құрдық.
Бірнеше басқа компанияда да істедім, бір кезде өз ісім туралы ойлай бастадым. Сол шамада Азизжон Азимимен таныстым. Бір күні ол сторисіне zypl.ai-да өнім жөніндегі жетекші керек екенін жазды, бизнес пен технологияны қатар түсінетін, өнім мен әзірлеу тобын басқаратын адам іздеп жатыр екен.
Оны көріп, «мен бұл орынға сай келетін сияқтымын» деп ойладым. Азизжонға жазып, сөйлесейік дедім. Сөйлестік, сөйтіп кейін командаға қосылдым.
— Ол кезде компания немен айналысып жатқан еді?
— Сол кезде стартаптың құрылғанына екі жылдай болған. zypl.ai идеясы Азизжонның Стэнфордта оқып жүрген кезінде пайда болған, ол сол кезде жасанды интеллект арқылы несие тәуекелін бағалайтын платформа концепциясын ойлап тапқан. Кейін Тәжікстанға оралғанда мұндай жобаны жүзеге асыра алатын мамандардың жоқтығын түсінген. Сол себепті инженерлер мен дата-сайентистерді дайындайтын AI академиясын құрды. Академия әлі де жұмыс істейді, ал оның түлектерінен zypl.ai-дың алғашқы командасы қалыптасты.
Бастапқыда компания банктердің әлеуетті клиенттерінің төлем қабілетін бағалау — скоринг технологиясына басымдық берді. Мысалы, адам қосымша арқылы несиеге өтініш бергенде, жүйе оның деректерін талдап, бірнеше секунд ішінде несиені мақұлдау, не бас тарту туралы шешім шығарады. Біз осындай алгоритмдерді — деректерді өңдеп, шешім шығаратын технологияларды жасаумен айналыстық.
«Қайтарылмаған несиелердің үлесін 30%-ға азайтамыз»
— Сіз келгеннен кейін zypl.ai-да не өзгерді?
— Мен қосылған кезде құрылым кәдімгі стартаптағыдай болатын, яғни нақты процестер мен рөлдер анықталмаған. Тіпті әркім өзіне ыңғайлы технологиялық стекпен жұмыс істейтін. Алдымен, осының бәрін реттедім: команданы бағыттар бойынша бөлдім, жауапкершілік аймақтарын нақтыладым және өнімдік roadmap енгіздім (яғни, команда қандай өнімді қашан әзірлейтінін көрсететін құжат немесе визуалды жоспар — Digital Business еск.).
Бұл қадам жүйесіз әрекеттен арылып, негізгі өнімдерге — ең алдымен, синтетикалық деректерді генерациялайтын zGAN технологиясы мен техникалық білімі жоқ мамандарға ML-модельдер құруға мүмкіндік беретін Lucid платформасына назар аударуға жағдай жасады.
— zGAN не үшін қажет екенін қарапайым тілмен түсіндіріп беріңізші.
— Мысалы, шағын банк бар делік. Күн сайын қызметкерлерге кімге несие беріп, кімге бас тарту керектігін шешуге тура келеді. Мұны қолмен немесе қарапайым ережелермен, мысалы, «егер табысы $1000-нан аз болса — бас тарту» қағидатымен істеу дәл емес, әрі қауіпті. Сондықтан банктер жүздеген көрсеткішті талдап, адамның несиені қайтара ала ма, жоқ па, соны болжайтын машиналық оқыту модельдерін пайдаланады.
Бірақ мұндай модельдің дұрыс жұмыс істеуі үшін көп, әрі сапалы деректер қажет. Ал шағын банктерде ондай деректер жоқ: клиент аз, несиелердің тарихы да жеткіліксіз. Біз осы мәселені шешеміз: біздің құрал жетіспейтін деректерді синтетикалық түрде толықтырып, модельді банк көп деректерге ие секілді етіп үйретуге мүмкіндік береді. Соның арқасында модель кім несиені қайтарады, ал кім қайтара алмауы мүмкін екенін дәлірек анықтайды.
— Ал ірі банктерге ше? Оларда деректер жетіспеу проблемасы жоқ қой.
— Иә, бірақ синтетикалық деректер тек жетіспейтінді толықтыру үшін емес, шынайы деректермен араластырып қолдануға да болады, бұл модельдің тұрақтылығын арттырады. zGAN сирек кездесетін немесе әлі болмаған макроэкономикалық сценарийлерді, мысалы, инфляцияның күрт өсуі немесе шикізат нарығының құлдырауы сияқты жағдайларды имитациялайтын «аномалды» деректерді де жасай алады.
Бірден айтайын, біз нақты жағдайларды, мысалы COVID-19 сияқты оқиғаларды болжай алмаймыз, бірақ соған ұқсас сценарийлерді жасап, модельге осындай ауытқулар болуы мүмкін екенін және оларға қалай жауап беру керектігін үйретеміз.
Егер ертең экономикалық құлдырау, валютаның әлсіреуі немесе жұмыссыздық белең алса, модель скорингте қателікке көп ұрынбайды, өйткені ол осындай жағдайларды оқыту кезінде «көріп» үйренген.
Кәдімгі модельдердің дәлдігі ай сайын өзгеріп тұруы мүмкін: бірде 95%, бірде 70%. Ал синтетикалық стресс-сценарийлермен үйретілген модельдің нәтижесі тұрақты, бұл реттеушілер үшін өте маңызды.
Толығырақ Digitalbusiness.kz сайтынан оқи аласыздар.