Для функционирования сайта могут собираться метаданные (сcookie, IP-адрес, местоположение). Если Вы не хотите, чтобы эти данные обрабатывались, то покиньте сайт.
OK
скачать
наборы данных
Мы выложили в открытый доступ несколько баз деперсонализированных биометрических образов, которые можно использовать исключительно для проведения исследований (статистического анализа данных с целью выявления закономерностей и классификации образов). Все базы полностью обезличены, не используются и не могут использоваться в целях идентификации личности конкретных субъектов (так как в них отсутствует необходимая для этого информация).

Ссылки на базы других исследователей (MNIST, Jakobovski) находятся в конце раздела
Эхограммы ушного канала
AIC-ears-75
(версия 1.0)
кол-во испытуемых: 75 человек
Набор обезличенных (деперсонализированных) данных эхограмм ушного канала 75 испытуемых возрастом 18-40 лет. Каждая эхограмма представлена в виде wav файла (моно, 44 кГц, 16 бит). Для каждого испытуемого сделано по 15 измерений каждого уха (+- 1), после каждого измерения испытуемый снимал и снова надевал наушники (устройство в виде наушников со встроенным микрофоном для регистрации отраженного сигнала). Каждому испытуемому было предложено прослушать звуковой моно-сигнал возрастающей и убывающей частоты (скользящий модулированный синус), получаемый путем линейной частотной модуляции (ЛЧМ-сигнал). Частота сигнала варьировалась в диапазоне от 1 кГц до 14 кГц, длительность сигнала составляла 10 секунд (5 сек. частота возрастает, 5 сек. - убывает). Набор данных включает 2 папки для правого и левого ушей, в каждой папке содержится по 75 вложенных папок с измерениями уха соответствующих испытуемых. СКАЧАТЬ
Рукописные образы №1
AIC-sign-130
(версия 1.0)
образы Своих (65 подписантов), образы Чужих (65 подписантов)
Обезличенные (деперсонализированные) рукописные образы, воспроизведенные 130 подписантами возрастом 18-50 лет. Каждый испытуемый выбирал слово или набор символов по своему усмотрению, которые воспроизводил на графическом планшете фирмы Wacom с частотой опроса 200 точек в секунду и 1024 уровнями давления пера на планшет. База представлена в 2-х вариантах:
1. Сырые данные, набор включает:
- образы "Свои" - 65 папок, каждая из которых содержит рукописные образы некоторого испытуемого (65 классов образов);
- образы "Чужие" - одна папка с 650 образами (один класс образов), воспроизведенными другими 65 испытуемыми (по 10 на человека). Рекомендуется использовать эту папку как тестовую выборку "Чужих" для оценки вероятности ошибки 2-го рода ("ложного допуска Чужого").
Каждый рукописный образ хранится в отдельном текстовом файле (формат SVG, не является форматом изображения), в котором каждая строчка описывает одну точку (отчет) рукописного образа: x;y;p (x, y -это координаты точки, p - это давление пера на планшет). Каждый образ - это набор точек (динамики) воспроизведения рукописного слова (символов), представленных в порядке регистрации устройством ввода СКАЧАТЬ
2. Обработанные данные - xml-файл (в сокращенном формате), который содержит описания этих же образов, но представленных в виде векторов из 556 признаков. Для извлечения признаков использовалась авторская методика. СКАЧАТЬ
Рукописные образы №2
AIC-sign-24
(версия 1.0)
24 подписанта
Небольшой набор признаков из обезличенных (деперсонализированных) рукописных образов 24 испытуемых (24 класса образов) возрастом 18-35 лет. Образы получены на планшете Wacom (частота опроса 200 точек в секунду, 1024 уровней давления) и представляют собой векторы из 335 признаков, полученные по упрощенной авторской методике. Файлы не содержат изображений рукописного образа. Набор данных представлен в 2-х вариантах:
- полный формат xml-файла. СКАЧАТЬ
- сокращенный формат xml-файла. СКАЧАТЬ
Клавиатурный почерк
AIC-key-32
(версия 1.0)
кол-во испытуемых: 32 человека
Небольшой набор обезличенных (деперсонализированных) данных клавиатурного почерка 32 испытуемых (32 класса образов) возрастом 18-35 лет. Перед прохождением тестов каждый испытуемый отдыхал в предшествующие сутки и находился на момент проведения опытов в спокойном состоянии. Неврологический статус всех испытуемых до начала эксперимента оценивался как нормальный. Образы представляют собой векторы из 63 признаков (временных задержек - времен удержания клавиш и пауз между нажатием соседних клавиш, зарегистрированных при наборе фразы "система защиты должна постоянно совершенствоваться"). Набор данных представлен в виде xml-файла в сокращенном формате. СКАЧАТЬ
Речевые образы
AIC-spkr-130
(версия 1.1)
образы Своих (65 дикторов),
образы Чужих (65 дикторов)
Обезличенные (деперсонализированные) образы речевых паролей, воспроизведенных 130 дикторами возрастом 18-50 лет. Речевые пароли представляли собой короткие фразы из одного, двух или трех (но коротких) слов ("разграничение доступа", "разрешите доступ"). Каждый испытуемый выбирал себе пароль из заранее подготовленного словаря. Пароли испытуемых не уникальны (т.е. одна ключевая фраза могла быть использована несколькими испытуемыми). Набор представляет собой "сырые" данные, разделенные по попыткам ввода. Каждый образ - это звуковой wav-файл (моно, 8 кГц, 16 бит), который содержит одну реализацию речевого пароля (диктор сказал пароль один раз). Набор включает:
- образы "Свои" - 65 папок, каждая из которых содержит речевые пароли некоторого испытуемого (65 классов образов);
- образы "Чужие" - одна папка с 650 образами (один класс образов) других речевых паролей, воспроизведенных другими 65 испытуемыми (по 10 на человека). Рекомендуется использовать эту папку как тестовую выборку "Чужих" для оценки вероятности ошибки 2-го рода ("ложного допуска Чужого").
СКАЧАТЬ
Данные передвижения манипулятора "мышь"
AIC-mouse-19
(версия 1.0)
кол-во испытуемых: 19 человек
Небольшой набор обезличенных (деперсонализированных) данных о передвижении манипулятора "мышь".
19 испытуемыми (19 классов образов) возрастом 18-30 лет при помощи специального устройства (компьютерная мышь, снабженная датчиками - гироскоп и акселерометр) в специально разработанной программе выполняли тестовые задания. Испытуемые прошли 2 серии тестов с, каждая серия состояла из 20 тестов. В первой серии тестов необходимо осуществлять перемещение курсора между элементами интерфейса, имеющими фиксированное положение на экране, вторая серия включала аналогичные тесты, но расположение элементов интерфейса определялось случайным образом.
Образ траекторий перемещения «мыши» состоит из 3-х функций ускорения по осям OX, OY, OZ и функции времени. Формат файла образа - текстовый SVG, каждая строка в файле имеет формат: «ускорение_Ох : ускорение_Оу : ускорение_Oz : время». В наборе 2 папки с двумя сериями тестов, в каждой папке вложено по 19 папок с данными соответствующих испытуемых. СКАЧАТЬ
ЭЭГ (база №1)
AIC-eeg-19
(версия 1.0)
прибор: Нейрон-Спектр 4/П
кол-во испытуемых: 18 человек
Обезличенные (деперсонализированные) электроэнцефалограммы (ЭЭГ) 18 испытуемых возрастом 21-30 лет. Перед прохождением тестов каждый испытуемый отдыхал в предшествующие сутки и находился на момент проведения опытов в спокойном состоянии. Неврологический статус всех испытуемых до начала эксперимента оценивался как нормальный. Опыты ориентированы на выработку стойких индивидуальных ответных реакций головного мозга на визуальный стимул, происходящих, прежде всего, в стриарной и экстрастриарной коре (поля 17, 18 и 19 по Бродману). Данные собирались при участии профессионального (практикующего) нейрофизиолога (невролога, сомнолога, кандидата медицинских наук), что подтверждает правильность использования электроэнцефалографического оборудования.
Испытуемые при помощи очков виртуальной реальности наблюдали за статическими (без анимации) визуальными стимулами, находясь в положении лежа. В качестве стимулов использовались геометрические фигуры различных цветов, а также "чернильные" цветные пятна Роршаха. Одновременно записывалась ЭЭГ головного мозга с помощью 21-канального электроэнцефалографа Нейрон-Спектр-4/П фирмы Нейрософт (с уровнем шума менее 0.3 мкВ и частотой квантования сигналов 5000 Гц на канал, в дальнейшем преобразуемой к частоте 500 Гц). Из 21 канала было задействовано 10 электродов: Fpz, Fp1, Fp2, Fz, F3, F4, Cz, Oz, O1, O2, подключение монополярное по схеме "10-20".
Большинство испытуемых прошли серию опытов дважды в разные дни (файлы отмечены номерами 1 и 2). ЭЭГ представлены в следующих вариантах:
  • файлы в формате edf+ (СКАЧАТЬ);
  • файлы в универсальном формате *.SHV для быстрой загрузки в AIC, записи нарезаны на образы, длительностью по 5 секунд (СКАЧАТЬ), 2,5 секунды (СКАЧАТЬ) и одной секунде (СКАЧАТЬ).
Номера испытуемых с 25 по 42.
Термограммы лица и шеи
(версия 1.0)
с учетом ПФС испытуемых
кол-во испытуемых: 84 человека
Обезличенные (деперсонализированные) образы термограмм лица и шеи (вместе в одном кадре) 84 испытуемых возрастом 18-28 лет, записанные на тепловизор Flir e60 (разрешение 320x240). При этом каждый испытуемый в разное время находился в следующих шести психофизиологических состояниях (ПФС):
  • "норма" (перед экспериментом испытуемый не подвергался каким-либо воздействиям, а его неврологический статус оценивался, как нормальный);
  • 3 стадии алкогольного опьянения с содержанием алкоголя в крови: 0,02-0,03‰, 0,03-0,05‰, 0,05-0,1‰ (перед экспериментом испытуемые принимали алкоголь, дозировка рассчитывалась по формуле Видмарка);
  • сонное (перед экспериментом испытуемые принимали седативные средства - валериану, пустырник в соответствии с прилагаемой инструкцией);
  • стресс (перед экспериментом испытуемые проходили тест Струпа).
Набор представляет собой "сырые" данные - каждая термограмма в отдельном бинарном файле. Набор данных включает 6 папок, в каждой папке находится 2520 термограмм субъектов в соответствующем состоянии (по 30 термограмм на каждого человека). СКАЧАТЬ


Ссылки на базы других исследователей
(версия 1.0)
которые были использованы в обучающих примерах AIC
База MNIST
Классический набор обезличенных (деперсонализированных) данных монохромных изображений цифр. Для удобства данная база встроена в AIC и ее не обязательно загружать непосредственно при работе в Конструкторе нейронных сетей (есть возможность выбрать при обучении и тестировании нейронной сети).
Мы продублировали базу MNIST в формате, более удобном для загрузки в AIC (исходные 4 архива распакованы и сгруппированы по двум папкам - test и train).
Рекомендуем использовать эту ссылку:
https://cloud.mail.ru/public/2zsb/3Us2KHBz3
Исходная ссылка на базу MNIST:
http://yann.lecun.com/exdb/mnist/

База Jakobovski
Набор обезличенных (деперсонализированных) данных звуков цифр. Мы продублировали эту базу в более удобном для загрузки в AIC формате (чтобы после загрузки в AIC они были ранжированы по классам, мы распределили соответствующие речевые образы по папкам). Рекомендуем использовать эту ссылку:
https://cloud.mail.ru/public/52Zx/3XEcEXRkr
Исходная ссылка на базу Jakobovski (записи находятся в папке recordings):
https://github.com/Jakobovski/free-spoken-digit-dataset

Made on
Tilda