Анализ данных. Рубрика в журнале - Компьютерная оптика

Публикации в рубрике (2): Анализ данных
все рубрики
Аналитическое представление статистических характеристик случайных процессов с произвольными спектрами

Аналитическое представление статистических характеристик случайных процессов с произвольными спектрами

Орлов Евгений Прохорович, Сизова Ирина Михайловна

Статья научная

Предложен метод аналитического представления статистических характеристик узкополосных случайных Гауссовых процессов с произвольными спектрами. Метод не доказан строго, но проверен в большом количестве численных расчётов.

Бесплатно

Выделение знаний, языковых форм их выражения и оценка эффективности формирования множества тематических текстов

Выделение знаний, языковых форм их выражения и оценка эффективности формирования множества тематических текстов

Михайлов Дмитрий Владимирович, Козлов Александр Павлович, Емельянов Геннадий Мартинович

Статья научная

Статья посвящена взаимосвязанным проблемам выделения единиц знаний из множества (корпуса) тематических текстов и отбора текстов в корпус анализом релевантности исходной фразе. Данные проблемы актуальны для построения систем обработки, анализа, оценивания и понимания информации. Конечной практической целью является поиск наиболее рационального варианта передачи смысла средствами заданного естественного языка для последующей фиксации фрагментов знаний в тезаурусе и онтологии предметной области. При этом релевантность текста по описываемому фрагменту знания (включая формы выражения в языке) определяется суммарной численной оценкой силы связи встречающихся в его фразах сочетаний слов исходной фразы. В настоящей работе рассматриваются известные варианты такой оценки и особенности их использования для выделения составляющих образа исходной фразы в виде слов и их сочетаний в текстах при формировании тематического текстового корпуса. По сравнению с поиском совокупностей указанных составляющих на синтаксически размеченном текстовом корпусе, предложенный в работе метод отбора текстов позволяет в среднем в 15 раз сократить выход фраз, не релевантных исходной ни по описываемому фрагменту знания, ни по языковым формам его выражения.

Бесплатно

Журнал