Для функционирования сайта могут собираться метаданные (сcookie, IP-адрес, местоположение). Если Вы не хотите, чтобы эти данные обрабатывались, то покиньте сайт.
OK
Как самостоятельно сформировать набор данных?
Кратко о форматах данных AIC
Загрузка данных и форматы
"Сырые" данные
AIC поддерживает ряд форматов для загрузки "сырых" (неразмеченных, частично размеченных) данных (csv, edf+, wav, бинарный и другие).

Возможность загрузить эти данные имеется в модуле анализа "сырых" данных (модуле извлечения признаков, рис. 1) и конструкторе нейронных сетей (рис. 2).

Так как каждая предметная область исследований имеет свою специфику, собрать набор "сырых" данных первоначально можно только с помощью сторонних программ, сохранив их в одном из поддерживаемых форматов.

Также имеется возможность пересохранить данные из специализированных форматов в универсальный формат (*.shv), который специально создан для быстрой загрузки любых данных (рис. 1, 2).

Обработанные данные (признаки)
Описания образов в виде векторов признаков можно хранить в одном из универсальных форматов. Загрузка производится из основного модуля (модуля статистической обработки, рис. 3).

Поддерживается 4 формата:

  1. xml (полный). Формат разработан специально для AIC и позволяет создавать сложные описания классов образов в любом пространстве признаков, независимо от предметной области. Поддерживается не только загрузка, но и сохранение в этот формат. Описание формата и пример приведены в листинге (в конце данной страницы);
  2. xml (сокращенный). Полностью аналогичен предыдущему за исключением того, что названия xml-тегов пишутся в сокращенном виде (таблица). Поддерживается загрузка и сохранение данных;
  3. txt 1. Упрощенный формат;
  4. txt 2. Упрощенный формат.

XML-формат (полный)
Данный формат можно использовать для составления собственного набора данных независимо от предметной области

Листинг
Структура файла

<?xml version="1.1" encoding="UTF-8" ?>

<!-- убедитесь, что кодировка указана верно -->


<Classes lang=”ru”>

<!-- lang - локализация, если в качестве разделителя запятая, он равен “ru”, если точка - “en” -->

<!-- Specification - текстовое описание признаков, полученных при различных условиях или от физически разных факторов -->

<Specification description="Эксперимент проводился в обычных условиях">

<!-- в теге Feature есть необязательный атрибут unused, который может быть равен любому значению, если он есть, то признак не используемый (выключен)-->

<Feature id="1" description="Расстояние между глазами" />

<Feature id="2" description="Цвет глаз" />

<Feature id="3" description="Отношение между размерами головы и лба" />

................................

</Specification >

<Features>

<!-- Class - описание пользователя -->

<Class name="Пользователь 1">

<!-- в теге Realization есть также необязательный атрибут timeId- Время получения реализации либо ее порядковый номер (в любом случае - это беззнаковое длинное целое unsigned long) -->

<Realization>

<Feature id="1" value="0,101" />

<Feature id="2" value="1" />

<Feature id="3" value="333" />

................................

</Realization>

<Realization>

<Feature id="1" value="0,254" />

<Feature id="2" value="1" />

<Feature id="3" value="342" />

................................

</Realization>

</Class>

<Class name="Пользователь 2">

<Realization>...................................</Realization>

<Realization>...................................</Realization>

...................................

</Class>

<Class .........................</Class>

...................................

</Features>

</Classes>

Простейший пример

<?xml version="1.0" encoding="windows-1251"?>

<Classes lang="ru">

<Specification description="Эксперимент по формированию рукописных паролей проводился в обычных условиях">

<Feature id="1" description="Rxy" />

<Feature id="2" description="Ryp" />

<Feature id="3" description="Rxp" />

<Feature id="4" description="Rxx" />

<Feature id="5" description="Ryy" />

<Feature id="6" description="Rpp" />

<Feature id="7" description="Ap1" />

<Feature id="8" description="Ap2" />

<Feature id="9" description="Ap3" />

<Feature id="10" description="Ap4" />

</Specification >

<Features>

<Class name="Пользователь 1">

<Realization>

<Feature id="1" value="-0,417" />

<Feature id="2" value="0,09" />

<Feature id="3" value="0,284" />

<Feature id="4" value="0,675" />

<Feature id="5" value="0,309" />

<Feature id="6" value="0,493" />

<Feature id="7" value="0,00137828" />

<Feature id="8" value="9,798E-5" />

<Feature id="9" value="5,498E-5" />

<Feature id="10" value="4,214E-5" />

</Realization>

</Class>

<Class name="Пользователь 2">

<Realization>

<Feature id="1" value="-0,534" />

<Feature id="2" value="0,07" />

<Feature id="3" value="0,312" />

<Feature id="4" value="0,234" />

<Feature id="5" value="0,754" />

<Feature id="6" value="0,134" />

<Feature id="7" value="0,00754334" />

<Feature id="8" value="7,798E-5" />

<Feature id="9" value="9,498E-5" />

<Feature id="10" value="3,214E-5" />

</Realization>

</Class>

</Features>

</Classes>

Принципы построения файла
1. Каждая реализация - одно измерение значений всех (или некоторых) признаков (например, одно перемещение мыши между 2 элементами, одна подпись, снимок лица и др.), т.е. один образец данных.
2. Каждый класс - это классифицируемый объект (пользователь, человек, субъект, явление и др.).
3. В каждом классе должна быть одна или несколько реализаций.
4. В реализациях может быть различное количество признаков и различное количество значений одного и того же признака (т.е. признаков с одинаковыми id), признаки могут быть представлены в любом порядке, даже в различном от реализации к реализации.
Пояснения
<Feature id="1" description="Rxy" /> - описания признаков, для каждого файла образов задаются однократно в блоке <Specification description>.
<Class name="Пользователь 1"> - название класса образов. Класс образов состоит из реализаций <Realization>, которая включает в себя значения признаков <Feature id="1" value="-0,417" />.

Убедитесь, что кодировка в теге <?xml ?> указана верно!

набор данных Рукописные подписи №2

XML-формат (сокращенный)
Сокращенный формат занимает меньше места на диске. Замените соответствующие теги и атрибуты на их аналоги по всему файлу

Таблица
Realization
Class
Feature
value
timeId
generated
description
name
Patterns
R
C
F
v
t
g
d
n
P
набор данных Рукописные подписи №2

Made on
Tilda