Платформа AI-датасетов в Казахстане

Ускорение развития искусственного интеллекта с помощью открытых данных
Получите доступ к государственным и открытым данным для старта AI-проектов.

AI Policy

Kazakhstan

Open Data

GovTech

AI Data

Open Sources

Partner Data

Open Sources

Cloud Support

Льготы и ресурсы для стартапов

Политика Казахстана в области искусственного интеллекта

 

Концепция развития искусственного интеллекта на 2024-2029 годы
Основами развития искусственного интеллекта являются качество и инструменты управления данными.


Сектор государственного управления
:

В Казахстане зарегистрировано более 183 информационных систем центральных государственных органов, обеспечивающих сбор и обработку данных для государственных нужд.

Финансовый сектор и бизнес:
Банковские учреждения, клиентские сервисы на основе облачных технологий и телекоммуникационные компании также активно генерируют большие данные, что способствует развитию AI в стране.

Узнать подробнее

Принять участие в развитии AI
Стать партнером

01

Предоставьте ваши данные для развития AI:

Поделитесь вашими наборами данных для поддержки новых AI-проектов и способствуйте развитию инновационных решений в ключевых отраслях.

02

Станьте партнером экосистемы AI:

Откройте возможности для сотрудничества с ведущими стартапами и специалистами, предоставляя данные для разработки практических и перспективных решений.

03

Повышайте ценность своих данных:

Взаимодействуйте с AI-проектами на ранних стадиях и наблюдайте, как ваши данные становятся основой для новых технологий, соответствующих вашим стратегическим целям.

РАБОТА С OPEN DATA

Типы лицензий
на датасеты

  • При работе с наборами данных важно понимать различные лицензии, регулирующие их использование.

     

    Ниже краткий обзор распространенных лицензий для наборов данных, от самых открытых до самых ограничительных:

    1. Public Domain
    Вы можете передать свой набор данных в общественности, отказываясь от всех прав. Это не лицензия в традиционном смысле, а передача вашей работы в неограниченное пользование общественности.

    2. CC-0 (Creative Commons Public Domain Dedication)
    Похожая на Public Domain, эта лицензия позволяет вам формально отказаться от своих прав, позволяя любому использовать ваш набор данных без ограничений.

    3. PDDL (Open Data Commons Public Domain Dedication and License)
    Еще одна лицензия схожая с лицензией Public Domain, PDDL позволяет владельцам наборов данных отказаться от прав, даже если местное законодательство не поддерживает такую передачу.

    4. CC-BY (Creative Commons Attribution 4.0 International)
    Эта открытая лицензия позволяет пользователям распространять и адаптировать ваш набор данных при условии, что они должным образом укажут авторство.

    5. CDLA-Permissive-1.0 (Community Data License Agreement – Permissive)
    Эта разрешительная лицензия позволяет пользователям использовать, изменять и распространять ваш набор данных при условии указания авторства, без ограничений на результаты вычислительного использования данных.

    6. ODC-BY (Open Data Commons Attribution License)
    Похожа на CC-BY, эта лицензия позволяет пользователям распространять и адаптировать набор данных с обязательным указанием авторства.

    7. CC-BY-SA (Creative Commons Attribution-ShareAlike 4.0 International)
    Эта лицензия позволяет пользователям распространять и адаптировать ваш набор данных при условии, что любые изменения или дополнения будут распространяться под той же лицензией. Эта "вирусная" лицензия может отпугнуть некоторых пользователей из-за таких условий.

    8. CDLA-Sharing-1.0 (Community Data License Agreement – Sharing)
    Лицензия, разработанная по принципу копилефта, позволяет пользователям распространять набор данных и их изменения под той же лицензией, обеспечивая, что любые адаптации останутся открытыми и с указанием авторства.

    9. ODC-ODbL (Open Data Commons Open Database License)
    Похожа на CC-BY-SA, эта лицензия позволяет распространять и адаптировать набор данных, при этом требуя, чтобы любые изменения распространялись под той же лицензией. Это также "вирусная" лицензия.

    10. CC BY-NC (Creative Commons Attribution-NonCommercial 4.0 International)
    Пользователи могут распространять и адаптировать ваш набор данных при условии указания авторства и отсутствия коммерческого использования.

    11. CC BY-ND (Creative Commons Attribution-NoDerivatives 4.0 International)
    Пользователи могут распространять ваш набор данных с указанием авторства, но не могут вносить изменения или модификации.

    12. CC BY-NC-SA (Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International)
    Эта ограничительная лицензия позволяет распространять и адаптировать набор данных только в некоммерческих целях, при этом требуя, чтобы любые изменения лицензировались на тех же условиях.

    13. CC BY-NC-ND (Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International)
    Одна из самых ограничительных лицензий, которая позволяет распространять только неизмененный набор данных для некоммерческих целей с указанием авторства. Адаптации не разрешены.

    14. Другие варианты лицензий
    Если необходимая лицензия отсутствует, вы можете указать свои собственные условия, выбрав опцию "Другое" при создании набора данных.

    15. Лицензия не указана
    Без лицензии ваш набор данных не может быть использован, распространен или адаптирован другими пользователями.

Изучите основные типы данных используемые для разработки AI-проектов

Предложить открытый датасет

Пространственные
3D-данные

Наборы данных с трехмерными моделями объектов, CAD-файлы, карты глубины и данные о движении.


Посмотреть

Аудио-речевые
данные

Наборы данных с аудиозаписями, размеченные речевые данные, аудиоклипы с разными акцентами и языками.

Посмотреть

 

Компьютерное
зрение

Наборы данных изображений и видео с аннотациями для распознавания объектов, лиц и сцен.


Посмотреть

Data Science и Machine Learning

Наборы данных с бизнес-данными, финансовыми записями, статистикой и временными рядами.


Посмотреть

Генерация
изображений


Наборы изображений, метаданные изображений, датасеты с примерами для генерации нового визуального контента.

Посмотреть

Обработка естественного языка
(NLP)

Текстовые корпуса, наборы данных с метками эмоций, контекстные тексты, записи диалогов.


Посмотреть

Обучение с
подкреплением (RL)


Симуляционные наборы данных, игровые среды, сценарии взаимодействий для обучения моделей на основе действий и обратной связи.

Посмотреть

Видеоданные



Видеоархивы с разметкой объектов и движений, данные для отслеживания поведения и действий в динамических сценах.

Посмотреть

Прочие полезные сервисы
Открытые источники данных и инструментов для исследований и разработки в области AI

Облачные Кредиты - Партнерские Программы для Стартапов



Microsoft for Startups Founders Hub

Бесплатный доступ к моделям OpenAI, до 150 000$ в виде кредитов Azure

Подать заявку

NVIDIA Inception Program

Специальные условия на аппаратные и программные продукты, облачные кредиты от партнеров NVIDIA

Подать заявку

Google for Startups Cloud Program 

До 200 000$ (до 350 000$ для стартапов в области искусственного интеллекта) в виде облачных кредитов в течение 2 лет

Подать заявку

Yandex Cloud Boost

Компании-резиденты Astana Hub могут получить грант на использование облачной платформы Yandex Cloud с зоной доступности на территории Казахстана.


Подать заявку

Digital Ocean Hatch

Digital Ocean Hatch - это глобальная программа для стартапов от DigitalOcean, которая позволяет стартапам расти и создавать в облаке. Становитесь частью Hatch и получите до $5000 кредитов на облачной платформе DigitalOcean's на 12 месяцев.

Подать заявку

Открытые наборы данных для исследований и разработки

Инструменты для работы с данными и AI

Облачные решения и ресурсы для разработчиков

Есть вопросы или предложения? Свяжитесь с нами

Закрыть