Astanahub Logo
Astanahub Logo
Басты бет
Қауымдастық
Салық жеңілдіктері
Бағдарламалар
Hub Market
Вакансиялар
Технологиялық тапсырмалар
Басқа ұсыныстар
Іс-шаралар
Онлайн курстар
Tech Orda
Қоныс аудару
Бізбен хабарласыңыз
Қосымша
Қосылу Кіру
Артқа
Жариялау

Постты

Іс-шараны

Вакансияны

Бастаманы

Технологиялық тапсырманы

  • Лента
  • Бағдарламалар
  • Салықтық жеңілдіктер
    • Қатысушы болу
    • Технопарк қатысушылары
  • Технологиялық тапсырмалар
  • Іс-шаралар
  • Нетворкинг
  • Tech Orda
  • Вакансиялар
  • Инфраструктура
    • Зертханалар мен жабдықтар
    • Astana Hub павильондары
    • Аймақтық Хабтар
  • Маркетплейс
  • Қоныс аудару
    • IT-компаниясын ашу
    • Expat Centre
  • Astanahub.com туралы
  • Бізбен хабарласу
  • Әлеуметтік желілер

astanahub.com © 2020-2025. Барлық құқықтар қорғалған

Құпиялылық саясаты Қолдану ережелері Қосымша F.A.Q.

Компьютерлік көру

Объектіні, бетті және көріністі тану үшін аннотацияланған кескін және бейне деректер жиыны.

ImageNet-AB

ImageNet-AB — бұл ImageNet жинағынан алынған деректер жинағы, ол компьютерлік көрудегі объектіні тану және классификациялау тапсыраларын зерттеуді жеңілдету үшін арнайы жасалған. Ол әр түрлі категорияларға ұйымдастырылған белгіленген суреттердің таңдаулы жинағын қамтиды, бұл машинамен оқыту модельдерін оқыту мен бағалауға арналған бай ресурс ұсынады. ImageNet-AB әр түрлі объектілердің көріністері мен күрделі сахналарға назар аударады, бұл оны визуалды тану технологияларындағы зерттеулерді ілгерілету үшін құнды құрал етеді.

Ақпарат алу

ImageNet 1K Resized 256

ImageNet 1K Resized 256 — бұл ImageNet деректер жинағының таңдаулы бөлімі, 1,000 категориядағы суреттер 256x256 пиксельге дейін кішірейтілген. Бұл деректер жинағы компьютерлік көру зерттеулерінде бейнені классификациялау және объектіні анықтау сияқты тапсырмалар үшін кеңінен қолданылады. Ол әр түрлі белгіленген суреттерді қамтиды, бұл визуалды тану тапсырмаларында машинамен оқыту модельдерін оқыту мен бағалауға арналған маңызды ресурс болып табылады.

Ақпарат алу

COCO (Common Objects in Context)

COCO (Common Objects in Context) — бұл компьютерлік көрудегі объектіні анықтау, сегментация және сипаттау тапсырмалары үшін арналған ауқымды деректер жинағы. Ол 330,000-нан астам суретті қамтиды, 80 түрлі категорияға жататын 2.5 миллионнан астам белгіленген объектілердің үлгілері бар. Деректер жинағы объектілердің өздерінің табиғи контексттерінде көрсетілген күрделі сахналарды қамтиды, бұл оны әртүрлі визуалды тану қосымшаларында машинамен оқыту модельдерін оқыту мен бағалауға арналған бай ресурс етеді.

Ақпарат алу

Open Images

Open Images — бұл объектіні анықтау және бейнені тану үшін арналған ауқымды деректер жинағы, 600-ден астам объект категориялары бойынша шамамен 9 миллион белгіленген суреттерден тұрады. Ол шынайы әлемнің әр түрлі көріністері мен объектілерін қамтиды, шектелген квадраттар, сегментация маскалары және бейне деңгейіндегі белгілермен аннотацияланған. Бұл деректер жинағы компьютерлік көру зерттеулерінде бейне классификациясы, объектіні анықтау және визуалды байланыс тану сияқты әр түрлі тапсырмалар үшін модельдерді оқыту мен бағалауға кеңінен қолданылады.

Ақпарат алу

CelebA

CelebA (CelebFaces Attributes Dataset) — бұл бет тану және атрибуттарды анықтау тапсырмалары үшін арналған ауқымды деректер жинағы. Ол 200,000-нан астам әйгілі тұлғалардың суреттерін қамтиды, олардың әрқайсысы жыныс, жас және әр түрлі бет ерекшеліктері сияқты 40 түрлі бет атрибуттарымен аннотацияланған. CelebA компьютерлік көру зерттеулерінде бет тану, эмоцияларды анықтау және беттердің генеративті моделін жасау сияқты тапсырмалар үшін модельдерді оқыту мен бағалауда кеңінен қолданылады, бұл оны бейнелерді өңдеу мен жасанды интеллект саласындағы зерттеулерді ілгерілету үшін құнды ресурс етеді.

Ақпарат алу

MNIST 

MNIST (Modified National Institute of Standards and Technology) — бұл қолмен жазылған цифрларды тану үшін кеңінен қолданылатын деректер жинағы. Ол 0-ден 9-ға дейінгі қолмен жазылған цифрлардың 70,000 суретін қамтиды, оның ішінде 60,000 оқу суреті және 10,000 тест суреті бар. Әр сурет — бұл бір цифрдың 28x28 пиксельді сұр түсті бейнесі. MNIST машинамен оқыту және компьютерлік көру зерттеулерінде классификация алгоритмдерін әзірлеу мен бағалау үшін стандарт ретінде жиі қолданылады, бұл оны бастаушылар мен тәжірибелі зерттеушілер үшін маңызды ресурс етеді.

Ақпарат алу

CIFAR-10

CIFAR-10 — бұл бейнелерді классификациялау тапсырмалары үшін кеңінен қолданылатын деректер жинағы, ол 10 түрлі класстағы 60,000 32x32 пиксельді түсті суреттерден тұрады, әр класс 6,000 суреттен. Класстарға ұшақтар, автомобильдер, құстар, мысықтар, мүйізтұмсықтар, иттер, бақалар, аттар, кеме және жүк машиналары кіреді. CIFAR-10 машинамен оқыту және компьютерлік көру зерттеулерінде классификация алгоритмдерін әзірлеу мен бағалау үшін стандарт ретінде жиі қолданылады, бұл оны бастаушылар мен тәжірибелі мамандар үшін маңызды ресурс етеді.

Ақпарат алу

HKR Dataset

HKR Dataset (Гонконг рестораны деректер жинағы) — бұл бейне тану, сезімдер анализі және ұсыныс жүйелері сияқты тапсырмалар үшін арналған ресторандарға қатысты суреттер мен мәтіндік деректердің жинағы. Ол тағам, асхана ортасы және клиенттердің өзара әрекеттестіктері сияқты түрлі типтегі суреттерді, сондай-ақ сәйкес пікірлер мен рейтингтерді қамтиды. Бұл деректер жинағы компьютерлік көру және табиғи тілдерді өңдеу саласындағы зерттеушілер мен әзірлеушілер үшін құнды ресурс болып табылады, клиенттердің талғамы мен асхана тәжірибелерін тереңірек түсінуге мүмкіндік береді.

Ақпарат алу

KZ Mushrooms Dataset

KZ Mushrooms Dataset — бұл Қазақстанда кездесетін әр түрлі саңырауқұлақ түрлеріне қатысты деректердің жинағы, классификация және түрлерді анықтау сияқты тапсырмалар үшін арналған. Ол физикалық сипаттамалар, мекендеу ортасы туралы ақпарат және жеуге жарамдылық мәртебесі сияқты деректерді қамтиды, бұл микология саласындағы зерттеушілер мен әуесқойлар үшін құнды ақпарат береді. Бұл деректер жинағы саңырауқұлақ түрлерін анықтау және классификациялау мақсатында машинамен оқыту модельдерін әзірлеуге пайдалы, қауіпсіз жиналатын практикасын насихаттауға ықпал етеді.

Ақпарат алу

Fashion MNIST

Fashion MNIST — бұл бейнелерді классификациялау үшін арналған деректер жинағы, ол киім заттарының 70,000 сұр түсті суретін қамтиды, 10 категорияға бөлінген, оның ішінде футболкалар, шалбар, пуловер, көйлектер, пальталар, сандалдар, жейделер, кроссовкалар, сөмкелер және тобық етік. Әр сурет 28x28 пиксель көлемінде. Fashion MNIST бастапқы MNIST деректер жинағының орнына қолдануға арналған, бұл оны сән индустриясындағы машинамен оқыту алгоритмдерін тестілеу мен бағалауда танымал таңдау етеді, сонымен қатар модельдерді оқыту мен бағалау үшін күрделі суреттер жиынтығын қамтамасыз етеді.

Ақпарат алу

CIFAR 100

CIFAR-100 — бұл бейнелерді классификациялау тапсырмалары үшін кеңінен қолданылатын деректер жинағы, 100 түрлі класстағы 60,000 32x32 пиксельді түсті суреттерден тұрады, әр класс 600 суреттен. Класстар 20 супер классқа топтастырылған, бұл белгіленген суреттердің бай және әр түрлі жиынтығын қамтамасыз етеді. CIFAR-100 машинамен оқыту және компьютерлік көру зерттеулерінде классификация алгоритмдерін әзірлеу мен бағалау үшін стандарт ретінде жиі қолданылады, бұл оны саладағы зерттеушілер мен мамандар үшін маңызды ресурс етеді.

Ақпарат алу

PASCAL VOC

PASCAL VOC (Visual Object Classes) — бұл компьютерлік көрудегі объектіні анықтау, сегментация және классификация үшін стандарт деректер жинағы. Ол адам, автомобиль, ит және жылқы сияқты 20 объект категориясынан алынған әр түрлі суреттерді қамтиды, объектілердің шектелген квадраттары мен пиксель деңгейіндегі сегментация маскаларына сәйкес аннотациялармен бірге. Деректер жинағы машинамен оқыту модельдерін оқыту мен бағалау үшін бай ресурс ұсынады, бұл оны визуалды тану және түсіну тапсырмаларындағы зерттеулер үшін маңызды етеді.

Ақпарат алу

LFW (Labeled Faces in the Wild)

LFW (Labeled Faces in the Wild) — бұл бет тану зерттеулері үшін арналған деректер жинағы, 13,000-нан астам бет бейнелерінен тұрады, олар интернеттен жинақталған. Суреттер әр түрлі позалар, эмоциялар және жарық жағдайлары бар түрлі тұлғаларды қамтиды. LFW бет тану алгоритмдерінің өнімділігін бағалау үшін кеңінен қолданылады және биометрикалық тану, компьютерлік көру және байланысты салалардағы зерттеушілер үшін маңызды ресурс болып табылады.

Ақпарат алу

ADE20K

ADE20K — бұл семантикалық сегментация үшін арналған ауқымды деректер жинағы, 150 объект категориясы бойынша пиксель деңгейіндегі белгілермен аннотацияланған 20,000-нан астам суреттен тұрады. Деректер жинағы жабық және ашық орталардан алынған әр түрлі көріністерді қамтиды, бұл оны сахнаны түсіну және объектіні тану модельдерін оқыту мен бағалау үшін жарамды етеді. ADE20K компьютерлік көру зерттеулерінде сегментация алгоритмдерін дамыту мен күрделі көріністерді түсінуді арттыру үшін кеңінен қолданылады.

Ақпарат алу

Oxford Pets

Электронды өтінішті толтыру және қажетті құжаттарды тіркеу
Ақпарат алу

SUN397

SUN397 — бұл көріністерді тану үшін арналған ауқымды деректер жинағы, 397 түрлі көрініс категориясынан 100,000-нан астам суреттен тұрады. Әр категория әр түрлі орталарды, мысалы, жағажайлар, ормандар, қала аудандары және ішкі кеңістіктерді бейнелейтін түрлі суреттерді қамтиды. Деректер жинағы көрініс белгілерімен аннотацияланған және компьютерлік көру саласындағы, әсіресе көрініс классификациясы мен түсіну тапсырмаларымен байланысты машиналық оқыту модельдерін оқыту мен бағалауға арналған құнды ресурс болып табылады.

Ақпарат алу

Indoor Scenes

Indoor Scenes деректер жинағы ішкі орталарды бейнелейтін суреттердің жинағын қамтиды, ол көрініс тану тапсырмалары үшін арналған. Ол асханалар, қонақ бөлмелері, жатын бөлмелері және кеңселер сияқты бірнеше категорияларды қамтиды, әр категорияда мыңдаған белгіленген суреттер бар. Бұл деректер жинағы ішкі көріністерді түсіну және классификациялау мақсатында машинамен оқыту модельдерін оқыту мен бағалауға арналған құнды ресурс болып табылады, бұл оны компьютерлік көру және робототехника саласындағы зерттеулер үшін пайдалы ресурс етеді.

Ақпарат алу

Stanford Dogs

Stanford Dogs деректер жинағы дәл классификациялау үшін арналған, 120 түрлі ит тұқымдарының 20,000-нан астам суретін қамтиды. Әр тұқым әр түрлі суреттермен ұсынылған, олар әр түрлі позалар, фондар және жағдайларды қамтиды. Деректер жинағы тұқым белгілерімен аннотацияланған, бұл оны ит тұқымдарын анықтау және визуалды тану сияқты тапсырмаларда машинамен оқыту модельдерін оқыту мен бағалауға арналған құнды ресурс етеді, бұл оны компьютерлік көру және жануарларды классификациялау саласындағы зерттеулер үшін маңызды етеді.

Ақпарат алу

Cityscapes Depth and Segmentation

Cityscapes Depth and Segmentation деректер жинағы қалалық көріністерді түсіну үшін арналған, тереңдік бағалауы мен семантикалық сегментация тапсырмаларына назар аударады. Ол әр түрлі қалалық орталардан жинақталған жоғары шешімді суреттерді қамтиды, әр объект категориясы үшін пиксель деңгейіндегі сегментация маскаларымен және тереңдік ақпаратпен аннотацияланған. Бұл деректер жинағы компьютерлік көру саласында, әсіресе автономды басқару, қалалық жоспарлау және робототехникамен байланысты қосымшаларда модельдерді оқыту мен бағалауға арналған құнды ресурс болып табылады, күрделі қалалық көріністерді жан-жақты түсінуге мүмкіндік береді.

Ақпарат алу

CBIS-DDSM (Curated Breast Imaging Subset of the Digital Database for Screening Mammography)

CBIS-DDSM (Цифрлық Маммография Скрининг Мәліметтер Базасының Кураторланған Сүт Безі Суреттері Жинағы) — сүт безі обыры зерттеулері мен маммографиялық суреттерді талдау үшін арнайы жасалған деректер жинағы. Ол қалыпты және аномальды табылымдарды қамтитын маммографиялық суреттердің кураторланған жиынтығын, сондай-ақ обыр диагноздары мен зақымдардың классификациялары сияқты байланысты аннотацияларды қамтиды. Бұл деректер жинағы автоматты обырды анықтау, диагностикалық дәлдікті арттыру және медициналық imaging саласындағы зерттеулерді ілгерілету сияқты тапсырмалар үшін машинамен оқыту модельдерін дамыту мен бағалауда құнды ресурс болып табылады.

Ақпарат алу

EuroSAT

EuroSAT — бұл жерді пайдалану және жер жамылғысын классификациялау үшін арналған деректер жинағы, ол Sentinel-2 жерсерігі суреттерінен жиналған 27,000-нан астам белгіленген суреттерді қамтиды. Деректер жинағы ормандар, шөпті жерлер және қалалық аудандар сияқты 10 түрлі классты қамтиды, географиялық ерекшеліктердің әртүрлі жиынтығын қамтамасыз етеді. EuroSAT алыстан зондтау қосымшаларында машинамен оқыту модельдерін оқыту мен бағалауда құнды ресурс болып табылады, бұл экологиялық мониторинг, қалалық жоспарлау және ауыл шаруашылығында жетістіктерге ықпал етеді.

Ақпарат алу

iNaturalist 2017 

iNaturalist 2017 — бұл түрлерді классификациялау және биоалуантүрлілік зерттеулері үшін арналған ауқымды деректер жинағы, ол өсімдіктердің, жануарлардың және саңырауқұлақтардың 5 миллионнан астам суретін қамтиды. Деректер жинағы мыңдаған түрлер үшін аннотацияларды қамтиды, түрлі қатысушылар мен көздерден жиналған. iNaturalist 2017 компьютерлік көру саласында, әсіресе түрлерді анықтау, экологиялық зерттеулер және сақтау әрекеттеріне қатысты қосымшаларда машинамен оқыту модельдерін оқыту мен бағалауға арналған бай ресурс болып табылады.

Ақпарат алу

UCF101

UCF101 — бұл видео клиптердегі әрекеттерді тану үшін арналған деректер жинағы, 101 әрекет категориясында 13,320 видеоны қамтиды. Деректер жинағы спорт, күнделікті әрекеттер және адам әрекеттері сияқты әр түрлі әрекеттерді қамтиды, машинамен оқыту модельдерін оқыту мен бағалауға арналған түрлі мысалдарды қамтамасыз етеді. UCF101 компьютерлік көру зерттеулерінде видеоларда адам әрекеттерін тануға арналған алгоритмдерді бенчмарктау мен әзірлеу үшін кеңінен қолданылады, бұл оны қауіпсіздік, робототехника және адам-компьютер өзара әрекеттесуі сияқты қосымшалар үшін құнды ресурс етеді.

Ақпарат алу

YouTube-8M 

YouTube-8M — бұл 8 миллионнан астам YouTube бейне ID-лері мен әр түрлі категорияларға арналған белгілерді қамтитын ауқымды бейнені классификациялау деректер жинағы. Ол әрекеттерді тану және бейнені түсіну үшін машинамен оқыту модельдерін оқыту мен бағалауға пайдаланылады.

Ақпарат алу

KITTI 

KITTI деректер жинағы автономды басқару және робототехника зерттеулерінде кеңінен қолданылатын ресурс. Ол нақты әлемдегі жүргізу сценарийлерінен стерео камера суреттерін, LiDAR нүктелік бұлттарын және GPS/IMU деректерін қамтиды. Аннотациялар стерео сәйкестендіру, объектіні анықтау және сахна ағындарын бағалау сияқты тапсырмаларды қамтиды.

Ақпарат алу

Visual Genome

Visual Genome — бұл визуалды түсіну деректер жинағы, 108,000-нан астам суретті объектілер, атрибуттар және қарым-қатынастар бойынша егжей-тегжейлі аннотациялармен қамтиды. Ол аймақтық сипаттамалар мен сұрақ-жауап жұптарын қамтиды, бұл оны компьютерлік көру зерттеулерінде объектіні анықтау, сахнаны түсіну және визуалды сұрақтарға жауап беру тапсырмаларында құнды етеді.

Ақпарат алу

Flickr8k

Flickr8k — бұл бейне сипаттау үшін арналған деректер жинағы, 8,000 суреттен тұрады, әр сурет бес түрлі сипаттамамен жұпталған. Деректер жинағы әр түрлі көріністерді қамтиды, бұл оны табиғи тілдерді өңдеу және компьютерлік көру саласындағы модельдерді оқыту мен бағалауға пайдалы етеді, әсіресе бейнені сипаттау генерациясы тапсырмаларында.

Ақпарат алу

CamVid

CamVid — бұл семантикалық сегментацияға арналған деректер жинағы, қозғалыстағы көліктен түсірілген қалалық көріністердің 700-ден астам суретін қамтиды. Әр сурет 32 объект категориясына пиксель деңгейіндегі белгілермен аннотацияланған, бұл оны автономды басқару және сахнаны түсінуге бағытталған компьютерлік көру қосымшаларында модельдерді оқыту мен бағалауға жарамды етеді.

Ақпарат алу

CheXpert

CheXpert — бұл кеуде рентген суреттерін талдау үшін арналған ауқымды деректер жинағы, 224,000-нан астам суреттерді қамтиды. Әр сурет 14 кең таралған кеуде ауруларымен аннотацияланған, соның ішінде пневмония және өкпе обыры, бұл оны медициналық бейнелеу және диагностикада машинамен оқыту модельдерін оқыту мен бағалауға құнды ресурс етеді.

Ақпарат алу

DeepFashion 

DeepFashion — бұл сәнді тану және талдау үшін арналған ауқымды деректер жинағы, 800,000-нан астам суреттерді әр түрлі киім категорияларында қамтиды. Ол атрибуттар, маңызды нүктелер және инстанция сегментациясы үшін аннотацияларды қамтиды, бұл оны компьютерлік көру саласындағы киімдерді іздеу, киім ұсынысы және сәндік заттарды классификациялау тапсырмаларында жарамды етеді.

Ақпарат алу

300W

300W деректер жинағы бет ерекшеліктерін анықтау үшін арналған, 3,000-нан астам суреттерді аннотацияланған бет ерекшеліктерімен қамтиды. Ол әр түрлі эмоцияларды, позаларды және жабуларды қамтиды, бұл оны компьютерлік көрудегі беттерді туралау және тану тапсырмаларында модельдерді оқыту мен бағалауға жарамды етеді.

Ақпарат алу

EMNIST (Extended MNIST)

EMNIST (Extended MNIST) — бұл қолмен жазылған символдарды тану үшін арналған деректер жинағы, бастапқы MNIST-ті әріптер мен қосымша қолмен жазылған символдарды қосу арқылы кеңейтеді. Ол EMNIST ByClass және ByMerge сияқты бірнеше кіші жиынтықтан тұрады, жалпы 800,000-нан астам суреттермен. EMNIST оптикалық символдарды тану және байланысты тапсырмаларда машинамен оқыту модельдерін оқыту мен бағалауда пайдалы.

Ақпарат алу

LabelMe 

LabelMe — бұл суреттерді аннотациялау үшін арналған деректер жинағы, 50,000-нан астам суреттерді егжей-тегжейлі объект сегментация маскаларымен және полигонды аннотациялармен қамтамасыз етеді. Ол әр түрлі көріністер мен объектілерді қамтиды, бұл оны объектіні анықтау, сегментация және сахнаны түсіну сияқты компьютерлік көру тапсырмаларында модельдерді оқыту мен бағалауға пайдалы етеді.

Ақпарат алу

Human3.6M 

Human3.6M — бұл адам қозғалысын тіркеуге арналған ауқымды деректер жинағы, 3.6 миллионнан астам 3D адам позаларын әр түрлі әрекеттер кезінде түсірген. Ол дене буындарының егжей-тегжейлі аннотацияларын және сәйкес видео тізбектерін қамтиды, бұл оны адам позаларын бағалау, әрекеттерді тану және компьютерлік көрудегі қозғалыс талдауында модельдерді оқыту мен бағалауда пайдалы ресурс етеді.

Ақпарат алу

CASIA Gait Database

CASIA Gait Database — бұл жүріс тану зерттеулері үшін арналған толық деректер жинағы, әр түрлі жағдайларда жүрген адамдардың 11,000-нан астам видео тізбегін қамтиды. Ол бірнеше көзқарас пен әр түрлі жүріс стильдерінен түсірілген деректерді қамтиды, бұл оны биометрикалық тану және компьютерлік көру қосымшаларындағы алгоритмдерді әзірлеу мен бағалауда пайдалы ресурс етеді.

Ақпарат алу

CIFAR-10H

CIFAR-10H — бұл CIFAR-10 деректер жинағының кеңейтілген нұсқасы, адамға бағытталған бейнені классификациялау тапсырмалары үшін арналған. Ол 60,000 түпнұсқа суретпен қатар, модель болжамдары туралы түсініктер беретін және классификаторлардың өнімділігін бағалауға көмектесетін адам бағалаушыларынан алынған қосымша аннотацияларды қамтиды. Бұл деректер жинағы бейнелерді тануда адам қабылдауын түсінуге пайдалы.

Ақпарат алу

MPII Human Pose Dataset

MPII Human Pose Dataset — бұл адам позаларын бағалау тапсырмалары үшін арналған деректер жинағы, 25,000-нан астам суреттерді дене буындарымен аннотациялаған. Ол нақты әлем сценарийлерінде түсірілген әр түрлі әрекеттер мен позаларды қамтиды, бұл оны адам позаларын анықтау, әрекеттерді тану және компьютерлік көрудегі байланысты қосымшаларда модельдерді оқыту мен бағалауда құнды етеді.

Ақпарат алу

Visual Dialog

Visual Dialog — бұл визуалды сұрақтарға жауап беру тапсырмалары үшін арналған деректер жинағы. Ол суретпен байланысты сұрақтар қойылған 120,000-нан астам суретті және жауаптармен диалогтарды қамтиды. Бұл деректер жинағы визуалды мазмұн контекстінде табиғи тілдерді түсінетін және генерирлейтін модельдерді оқыту мен бағалауда құнды ресурс болып табылады, компьютерлік көру мен сөйлесу ИИ саласындағы қосымшаларды жетілдіруге ықпал етеді.

Ақпарат алу

Google Landmark Dataset 

Google Landmark Dataset — бұл ескерткіштерді тану және іздеу тапсырмалары үшін арналған ауқымды деректер жинағы, әлемнің түкпір-түкпірінен 2 миллионнан астам ескерткіштердің суреттерін қамтиды. Әр сурет белгілі бір ескерткіш атауымен белгіленген, бұл оны компьютерлік көрудегі машинамен оқыту модельдерін оқыту мен бағалауда, әсіресе сурет іздеу және географиялық ақпарат жүйелерімен байланысты қосымшаларда пайдалы ресурс етеді.

Ақпарат алу

MegaFace 

MegaFace — бұл бет тану үшін арналған ауқымды деректер жинағы, алгоритмдерді әр түрлі жағдайларда бағалау үшін жасалған. Ол 672,000-нан астам тұлғадан 4.7 миллионнан астам бет бейнелерін қамтиды. Деректер жинағы поза, жарықтандыру және эмоциялар сияқты қиын жағдайларды қамтиды, бұл оны бет тану жүйелерін оқыту мен бенчмарктауға құнды ресурс етеді.

Ақпарат алу

Visual Question Answering (VQA)

Visual Question Answering (VQA) деректер жинағы суреттерге қатысты сұрақтарға жауап беру тапсырмалары үшін арналған. Ол 265,000-нан астам сурет және 1.1 миллион сұрақтан тұрады, оларға сәйкес жауаптармен. Бұл деректер жинағы визуалды түсінікті және табиғи тілдерді өңдеуді біріктіретін модельдерді оқыту мен бағалауда құнды ресурс болып табылады, ИИ мен компьютерлік көрудегі қосымшаларды жетілдіруге ықпал етеді.

Ақпарат алу

Fashion 150K

Fashion 150K деректер жинағы сән заттарын тану үшін арналған ауқымды суреттер жинағы, 150,000 суретті киім, аксессуарлар және аяқ киім сияқты әр түрлі категорияларда қамтиды. Әр сурет егжей-тегжейлі белгілермен аннотацияланған, бұл оны сәнмен байланысты тапсырмаларда, соның ішінде заттарды классификациялау және іздеу үшін машинамен оқыту модельдерін оқыту мен бағалауда пайдалы етеді.

Ақпарат алу

Tate Dataset 

Tate Dataset — бұл Tate галереяларынан алынған өнер туындыларының, соның ішінде суреттер, мүсіндер және фотографиялар, жоғары сапалы суреттер жинағы. Ол суретші, атау және материал сияқты әр түрлі атрибуттарға аннотацияларды қамтиды, бұл оны өнерді тану және классификациялау тапсырмаларында машинамен оқыту модельдерін оқыту мен бағалауда, сондай-ақ мәдени мұра зерттеулерінде пайдалы етеді.

Ақпарат алу

BIGstockimage2M

BIGstockimage2M — бұл 2 миллионнан астам түрлі категориялар мен тақырыптарды қамтитын ауқымды сток суреттер деректер жинағы. Әр сурет сәйкес кілт сөздер мен сипаттамалармен таңбаланған, бұл оны бейнелерді классификациялау, іздеу және мазмұнға негізделген бейне талдау тапсырмаларында машинамен оқыту модельдерін оқыту мен бағалауға жарамды етеді.

Ақпарат алу

RDD 2020 (Reddit Data Dataset 2020)

RDD 2020 (Reddit Data Dataset 2020) — бұл Reddit-тен алынған 1.4 миллиардтан астам посттар мен комментарийлерді қамтитын ауқымды деректер жинағы. Ол әр түрлі subreddit және тақырыптар бойынша деректерді қамтиды, бұл оны табиғи тілдерді өңдеу, сезімдер анализі және әлеуметтік медиа зерттеулері үшін құнды ресурс етеді. Деректер жинағы онлайн өзара әрекеттесуді түсінуге бағытталған модельдерді дамыту мен бағалауға қолдау көрсетеді.

Ақпарат алу
QR

Мобильді қосымша

Unicorn Game ойынына қосылыңыз

© 2025, «Инновациялық технологиялар паркі» Дербес кластерлік қоры

Құпиялылық саясаты Пайдаланушы келісімі F.A.Q.

Кіру

Аккаунт жоқ па? Тіркеу
Құпия сөзді ұмыттыңыз ба?

Авторизация

Сізге ыңғайлы авторизация әдісін таңдаңыз
  • Google тіркеулік жазбасымен жалғастыру
  • ЭЦҚ көмегімен жалғастыру
  • Электрондық пошта арқылы кіру
Аккаунт жоқ па? Тіркеу
Пайдаланушы аты мен парольдің құпиялылығын қамтамасыз етуді сұраймыз! Жалғастыра отырып, сіз Astana Hub шарттары мен ұсыныстарын қабылдайсыз

Тіркеу

Сізге ыңғайлы тіркеу әдісін таңдаңыз
  • Google тіркеулік жазбасымен жалғастыру
  • ЭЦҚ көмегімен жалғастыру
  • Email арқылы тіркелу
Есептік жазба бар ма? Кіру
Пайдаланушы аты мен парольдің құпиялылығын қамтамасыз етуді сұраймыз! Жалғастыра отырып, сіз Astana Hub шарттары мен ұсыныстарын қабылдайсыз

Тіркеу

Есептік жазба бар ма? Кіру

Вход через ЭЦП

У меня уже есть аккаунт. Хочу войти

ИИН:

Регистрация через ЭЦП

У меня уже есть аккаунт. Хочу войти

ИИН:

Продолжая, Вы принимаете условия и предложения AstanaHub

Регистрация

Войти под другим логином

Пройдите по ссылке, которую мы отправили Вам на почту , для завершения регистрации

Восстановление пароля

Смена пароля

Ваш пароль устарел. Пожалуйста, смените пароль в целях безопасности

Құпия сөзді өзгерту

Добавить email

Жүйеге кіру кезінде пайдаланылатын жаңа электрондық пошта мекенжайын енгізіңіз


Телефон нөмірін қосу

Введите новый номер телефона, который будет использоваться при авторизации в системе


Қалпына келтіру

Басқа пайдаланушы атымен кіріңіз

Құпия сөзді қалпына келтіру үшін, сілтеме алатын электрондық пошта мекенжайын енгізіңіз

Басқа пайдаланушы ретінде кіру

Біз сізге жіберген сілтеме бойынша өтіңіз

Успешная регистрация!

Поздравляем, вы успешно зарегистрированы на платформе astanahub.com

Отлично

Сіздің аккаунтыңыз
бұғатталды

Басқа пайдаланушы ретінде кіру

Себебі сіз парольді і реттен артық қате еңгіздіңіз

Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

Кіру

Немесе
Gmail арқылы кіру
Пайдаланушы аты мен парольдің құпиялылығын қамтамасыз етуді сұраймыз! Жалғастыра отырып, сіз Astana Hub шарттары мен ұсыныстарын қабылдайсыз
Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

Құпия сөзді енгізіңіз
Пошта арқылы кіріп жатырсыз

Құпия сөзді ұмыттыңыз ба?
Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

Құпия сөзді енгізіңіз
Телефон нөмірі арқылы кіріп жатырсыз

Құпия сөзді ұмыттыңыз ба?
Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

SMS кодын енгізіңіз
Біз SMS кодын сіздің нөміріңізге жібердік

Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

SMS кодын енгізіңіз
Біз SMS кодын сіздің нөміріңізге жібердік

Кодты қайтадан сұрау 0 секундттан кейін
Кодты қайтадан сұрау
Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

Құпия сөзді ойлап табыңыз

Кем дегенде 8 таңба

A-Z бас әріптері

Кіші әріптер a-z

Бір Сан

Бір арнайы таңба

Тіркеу аяқталғаннан кейін біз сізді Astana Hub экожүйесіндегі желіге қосылу үшін автоматты түрде «Нетворкинг» бөліміне қосамыз.

Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

SMS кодын енгізіңіз
Біз SMS кодын сіздің нөміріңізге жібердік

Кодты қайтадан сұрау 0 секундттан кейін
Кодты қайтадан сұрау
Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

Есіміңіз кім?

«Нетворкинг» бөлімі желіні дамытуға, пікірлес адамдарды табуға және іскерлік байланыстарды кеңейтуге арналған.

Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

Құпия сөзді енгізіңіз
Пошта арқылы кіріп жатырсыз

Құпия сөзді ұмыттыңыз ба?
Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

Растау кодын енгізіңіз
Біз кодты сіздің поштаңызға жібердік

Кодты қайтадан сұрау
Стартаптардың, инвесторлар мен сарапшылардың коммуникацияларына арналған цифрлық технопарк

Сіздің аккаунтыңыз
бұғатталды

Себебі сіз парольді і реттен артық қате еңгіздіңіз

Кұпия сөзді қалпына келтіру
Басқа пайдаланушы ретінде кіру