Анализ данных осуществляется в системах. Введение в анализ данных. Примеры алгоритмов распознавания

Испускаемое релятивистскими заряж. частицами в однородном магн. поле. Излучение частиц, движущихся в переменных электрич. и магн. полях, наз. ондуляторным излучением . С. и. обусловлено ускорением частиц, появляющемся при искривлении их траекторий в магн. поле. Аналогичное излучение нерелятивистских частиц, движущихся по круговым или спиральным траекториям, наз. излучением; оно происходит на осн. гиромагн. частоте и её первых гармониках. С увеличением скорости частицы роль высоких гармоник возрастает; при приближении к релятивистскому пределу излучение в области наиб. интенсивных высоких гармоник обладает практически непрерывным спектром и сосредоточено в направлении мгновенной скорости частицы в узком конусе с углом раствора , где т - масса покоя,- энергия частицы.

Полная мощность излучения частицы с энергией равна где е - частицы, - составляющая магн. поля, перпендикулярная её скорости. Т.к. излучаемая мощность сильно зависит от массы частицы, С. и. наиб. существенно для лёгких частиц - электронов и позитронов. Спектральное (по частоте ч )распределение излучаемой мощности определяется выражением

где , а - цилиндрич. ф-ция второго рода мнимого аргумента. Характерная частота, на к-рую приходится максимум в спектре излучения частицы:

Излучение отд. частицы в общем случае эллиптически поляризовано, причём большая ось эллипса расположена перпендикулярно видимой проекции магн. поля. Степень эллиптичности и направление вращения вектора напряжённости электрич. поля зависят от направления наблюдения по отношению к конусу, описываемому вектором скорости частицы вокруг направления магн. поля. Для направлений наблюдения, лежащих на этом конусе, поляризация излучения линейная.

Впервые С. и. предсказано А. Шоттом (A. Schott, 1912) и наблюдалось в циклич. ускорителях электронов (в синхротроне, поэтому и получило назв. С. и.). Потери энергии на С. и., а также связанные с С. и. квантовые эффекты в движении частиц необходимо учитывать при конструировании циклич. ускорителей электронов высокой энергии. С. и. циклич. ускорителей электронов используется для получения интенсивных пучков поляризов. эл--магн. излучения в УФ-области спектра и в области «мягкого» рентг. излучения; пучки рентг. С. и. применяются в рентгеновском структурном анализе , рентг. спектроскопии и др.

Большей интерес представляет С. и. космич. объектов, в частности нетепловой радиофон Галактики, нетепловое радио- и оптич. излучение дискретных источников (сверхновых звёзд, пульсаров, квазаров, радиогалактик). Синхротронная природа этих излучений подтверждается особенностями их спектра и поляризации. Релятивистские электроны, входящие в состав космич. лучей, в космич. магн. полях дают синхротронную составляющую космич. излучения в радио-, оптическом и рентг. диапазонах. Измерения спектральной интенсивности и поляризации космич. С. и. позволяют получить информацию о концентрации и энергетич. спектре релятивисгских электронов, величине и направлении магн. полей в удалённых частях Вселенной.

Синхротронное излучение

Анимация

Описание

Синхротронное (магнитотормозное) излучение - это излучение электромагнитных волн заряженными частицами, движущимися с релятивистскими скоростями в однородном магнитном поле. Синхротронное излучение обусловлено ускорением, связанным с искривлением траекторий частиц в магнитном поле. Аналогичное излучение нерелятивистских частиц, движущихся по круговым или спиральным траекториям, называется циклотронным излучением; оно происходит на основной гиромагнитной частоте и ее первых гармониках. С увеличением скорости частицы роль высоких гармоник возрастает; при приближении к релятивистскому пределу излучение в области наиболее интенсивных высоких гармоник обладает практически непрерывным спектром и сосредоточено в направлении мгновенной скорости в узком конусе с углом раствора:

где m и e - масса и энергия частицы.

Полная мощность излучения частицы с энергией равна:

где е - заряд частицы;

Напряженность составляющей магнитного поля, перпендикулярной скорости частицы.

Сильная зависимость излучаемой мощности от массы частицы делает синхротронное излучение существенным для легких частиц - электронов и позитронов. Спектральное (по частоте n ) распределение излучаемой мощности определяется выражением:

,

где ;

К 5/3 (h ) - цилиндрическая функция второго рода мнимого аргумента.

График функции , т.е. обезразмеренного спектрального распределения, представлен на рис. 1.

Обезразмеренное спектральное распределение синхротронного излучения

Рис. 1

x - безразмерная частота, нормированная на синхротронную.

Характерная частота, на которую приходится максимум в спектре излучения частицы, равна (в Гц):

Излучение отдельной частицы в общем случае эллиптически поляризовано с большой осью эллипса поляризации, расположенной перпендикулярно видимой проекции магнитного поля. Степень эллиптичности и направление вращения вектора напряженности электрического поля зависят от направления наблюдения по отношению к конусу, описываемому вектором скорости частицы вокруг направления магнитного поля. Для направлений наблюдения, лежащих на этом конусе, поляризация линейная.

Временные характеристики

Время инициации (log to от -9 до -6);

Время существования (log tc от -9 до 6);

Время деградации (log td от -9 до -6);

Время оптимального проявления (log tk от -1 до 5).

Диаграмма:

Технические реализации эффекта

Техническая реализация эффекта

Эффект реализуется в мощных ускорителях заряженных частиц - синхротронах и циклотронах.

Применение эффекта

Впервые синхротронное излучение наблюдалось в циклических ускорителях электронов (в синхротроне , поэтому и получило название "Синхротронный излучатель"). Потери энергии на синхротронном излучателе, а также связанные с синхротронным излучением квантовые эффекты в движении частиц необходимо учитывать при конструировании циклических ускорителей электронов высокой энергии. Синхротронный излучатель циклических ускорителей электронов используется для получения интенсивных пучков поляризованного электромагнитного излучения в ультрофиолетовой области спектра и в области "мягкого" рентгеновского излучения; пучки рентгеновского синхротронного излучения применяется, в частности, в рентгеновском структурном анализе.

Большой интерес представляет синхротронное излучение космических объектов, в частности, нетепловой радиофон Галактики, нетепловое радио- и оптическое излучение дискретных источников (сверхновых звезд, пульсаров, квазаров, радиогалактик ). Синхротронная природа этих излучений подтверждается особенностями их спектра и поляризации. Согласно современным представлениям, релятивистские электроны, входящие в состав космических лучей, дают синхротронное излучение в космических магнитных полях в радио-оптическом, а возможно, и в рентгеновском диапазонах. Измерение спектральной интенсивности и поляризации космического синхротронного излучения позволяют получить информацию о концентрации и энергетическом спектре релятивистских электронов, величине и направлении магнитных полей в удаленных частях Вселенной.

Пример. Синхротрон электронный.

Синхротрон электронный - кольцевой резонансный ускоритель электронов (позитронов) на энергии от нескольких МэВ до десятков ГэВ, в котором частота ускоряющего электрического поля не меняется, ведущее магнитное поле увеличивается во времени и равновесная орбита не меняется в процессе ускорительного цикла. Обычно электроны уже при инжекции являются ультрарелятивистскими; если же ускорение начинается с энергий Ј 5 - 7 МэВ, то в начале ускорительного цикла применяется бетатронный режим ускорения (см. Бетатрон).

Траектории ускоряемых в синхротроне электронов (позитронов) заполняют кольцевую область в вакуумной камере ускорителя. Обращаясь в ней, частицы многократно возвращаются к одним и тем же ускоряющим промежуткам, на которые подано переменное напряжение с частотой, в целое число раз q (q і 1) превосходящее частоту обращения частиц по так называемой равновесной орбите. Число q называют кратностью ускорения. При каждом прохождении через промежуток фаза идеальной (равновесной) частицы остается неизменной, но фаза реальных частиц немного изменяется, колеблясь около равновесного (синхронного) значения. При ускорении пучок частиц разбивается на сгустки - банчи, заполняющие некоторую область около синхронных значений фазы. Максимальное число сгустков на орбите равно q .

Траектория частиц в электронном синхротроне изгибается с помощью дипольных магнитов, создающих ведущее (поворотное) магнитное поле. Для фокусировки частиц в современных электронных синхротронах обычно используются поля с большим градиентом магнитной индукции (жесткая, или сильная фокусировка). Изгибающие и фокусирующие функции магнитного поля могут совмещаться (магниты с совмещенными функциями) или разделяться (магнитная система с разделенными функциями). В последнем случае поворотные магниты (изгибающие траекторию частиц) создают однородные поля. Магнитная индукция в поворотных магнитах (и ее производная в магнитных линзах) в течении ускорительного цикла непрерывно возрастает (чаще всего во много раз) в соответствии с ростом импульса ускоряемых частиц.

На криволинейных участках траектории пучки электронов (позитронов) испускают синхротронное излучение, мгновенная мощность которого в расчете на один электрон определяется формулой:

где е - заряд частиц;

g - ее лоренц - фактор (отношение полной энергии частицы к ее энергии покоя);

R(s) - радиус кривизны траектории на участке с координатой s.

Мощность, рассеиваемая за оборот, пропорциональна . При больших энергиях частиц потери на излучение могут составлять несколько МэВ на оборот. Чтобы уменьшить потери, приходится увеличивать размеры электронного синхротрона, что сопряжено с увеличением стоимости их строительства. Размеры реальных электронных синхротронов (иногда до км) определяются разумным компромиссом между эксплуатационными (гл. образом электроэнергии) и капитальными затратами. Потери на излучение приходится компенсировать, поэтому процесс ускорения электронов выгодно вести быстро, за сравнительно небольшое число оборотов (быстроциклические электронные синхротроны). Пиковая мощность ускоряющей высокочастотной системы электронного синхротрона на энергии в десятки ГэВ может достигать ~1 МВт.

Литература

1. Физика. Большой энциклопедический словарь.- М.: Большая Российская энциклопедия, 1999.

2. Новый политехнический словарь.- М.: Большая Российская энциклопедия, 2000.

Ключевые слова

  • синхронное излучение
  • заряженные частицы
  • релятивистский закон движения
  • однородное магнитное поле
  • излучение электромагнитных волн

Разделы естественных наук:

Учебное пособие

ББК 22.172я73

Рецензенты:

Мартышенко С.Н.

Компьютерный анализ данных:

Учебное пособие. – Владивосток: Изд-во ВГУЭС, 2010. – 80 с.

Составлено в соответствии с учебной программой по дисциплине «Компьютерный анализ данных» и требованиями государственного стандарта России. Предназначена для студентов специальностей 0618000 Математические методы в экономике и 351400 «Прикладная информатика в экономике». Содержит теоретический материал по дисциплине, задания к практическим занятиям и указания к их выполнению.

Утверждена на заседании кафедры Математики и моделирования 19.10.08***,протокол№ 18 ***

© Издательство Владивостокского государственного университета

экономики и сервиса, 2010

Введение

Для современной науки и большинства направлений практической деятельности сейчас характерен статистический подход. Закономерности экономики только в среднем смогут считаться детерминистическими, при более детальном исследовании оказывается, что они носят типично случайный характер.

В пособии рассматриваются теоретические и практические вопросы анализа статистических данных. Компьютерный анализ данных следует рассматривать как изучение методик практического применения теоретических методов математической статистики. Прикладной характер, изучаемой дисциплины подчеркивается ориентацией ее на применение конкретного программного продукта EXCEL.

Социально-экономические процессы и явления зависят от большого количества характеризующих их параметров, что обуславливает трудности, связанные с выявлением структуры взаимосвязей этих параметров. В подобных ситуациях, когда решение принимается на основе анализа стохастической, неполной информации необходимо применение методов статистического анализа данных.

Методы анализа данных позволяют обоснованно выбрать среди множества возможных вероятностно-статистических моделей такую, которая наилучшим образом соответствует исходным статистическим данным, характеризующим реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании большого статистического материала.

В пособии рассматривается совокупность глубоко формализованных статистических методов, базирующихся на представлении исходной информации в многомерном геометрическом пространстве и позволяющих определять неявные (латентные), но объективно существующие закономерности в организационной структуре и тенденциях развития изучаемых социально-экономических процессов и явлений.

Основной задачей пособия является обучение студентов теоретическим основам наиболее распространенных методов статистического анализа данных и развития навыков применения стандартных программных средств, в которых реализованы процедуры статистического анализа данных.

Для успешного изучения материала, изложенного в пособии студенту необходимы знания по основным разделам «Высшей математики» и «Математическая статистика». Необходимы знания таких основополагающих понятий как: виды случайных величин, характеристики случайных величин, основные законы распределения случайных величин, способы оценки выборочных характеристик, основы статистического вывода с использованием статистических критериев и проверки гипотез, линейная и нелинейная регрессии.

В ходе изучения материала, изложенного в пособии, у студента должно формироваться представление о конкретных практических ситуациях, в которых необходимо использование методов статистического анализа.

В результате работы с пособием и выполнения практических заданий студенту необходимо достигнуть определенного уровня знаний в области компьютерного анализа данных. Необходимый уровень знаний состоит из трех пунктов.

1. освоить:

Концепцию и технологии современного анализа данных на компьютере;

Принципы работы программных средств, предназначенных для статистического анализа данных;

Принципы работы современных визуальных методов анализа данных и использования их для статистического вывода и формулировки гипотез о структуре данных.

2. Выработать умения самостоятельного решения задач по выбору методов анализа в практических ситуациях;

3. полученть навыкиприменения программных систем; предназначенных для статистического анализа данных, а также тестирования программных модулей на модельных данных.

При анализе информации вы часто будете сталкиваться с тем, что теоретическое великолепие методов анализа разбивается о действительность. Ведь вроде все давно решено, известно множество методов решения задач анализа. Почему же довольно часто они не работают?

Дело в том, что безупречные с точки зрения теории методы имеют мало общего с действительностью. Чаще всего аналитик сталкивается с ситуацией, когда трудно сделать какие-либо четкие предположения относительно исследуемой задачи. Модель не известна, и единственным источником сведений для ее построения является таблица экспериментальных данных типа "вход – выход", каждая строка которой содержит значения входных характеристик объекта и соответствующие им значения выходных характеристик.

В результате они вынуждены использовать всякого рода эвристические или экспертные предположения и о выборе информативных признаков, и о классе моделей, и о параметрах выбранной модели. Эти предположения аналитика основываются на его опыте, интуиции, понимании смысла анализируемого процесса. Выводы, получаемые при таком подходе, базируются на простой, но фундаментальной гипотезе о монотонности пространства решений, которую можно выразить так: "Похожие входные ситуации приводят к похожим выходным реакциям системы". Идея на интуитивном уровне достаточно понятная, и этого обычно достаточно для получения практически приемлемых решений в каждом конкретном случае.

В результате применения такого метода решений академическая строгость приносится в жертву реальному положению вещей. Собственно, в этом нет ничего нового. Если какие – то подходы к решению задачи вступают в противоречие с реальностью, то обычно их изменяют. Возвращаясь к анализу данных, или, вернее, к тому, что сейчас называют Data Mining, следует обратить внимание еще на один момент: процесс извлечения знаний из данных происходит по той же схеме, что и установление физических законов: сбор экспериментальных данных, организация их в виде таблиц и поиск такой схемы рассуждений, которая, во-первых, делает полученные результаты очевидными и, во-вторых, дает возможность предсказать новые факты. При этом имеется ясное понимание того, что наши знания об анализируемом процессе, как и любом физическом явлении, в какой – то степени приближение. Вообще, всякая система рассуждений о реальном мире предполагает разного рода приближения. Фактически термин Data Mining – это попытка узаконить физический подход в отличие от математического к решению задач анализа данных. Что же мы вкладываем в понятие "физический подход"?

Это такой подход, при котором аналитик готов к тому, что анализируемый процесс может оказаться слишком запутанным и не поддающимся точному анализу с помощью строгих аналитических методов. Но можно все же получить хорошее представление о его поведении в различных обстоятельствах, подходя к задаче с различных точек зрения, руководствуясь знанием предметной области, опытом, интуицией и используя различные эвристические подходы. При этом мы движемся от грубой модели ко все более точным представлениям об анализируемом процессе. Слегка перефразировав Р. Фейнмана, скажем так: можно идеально изучить характеристики анализируемой системы, стоит только не гнаться за точностью.

Общая схема работы при этом выглядит следующим образом:

Таким образом, данный подход подразумевает, что:

  1. При анализе нужно отталкиваться от опыта эксперта.
  2. Необходимо рассматривать проблему под разными углами и комбинировать подходы.
  3. Не стоит стремиться сразу к высокой точности. Двигаться к решению нужно от более простых и грубых моделей ко все более сложным и точным.
  4. Стоит останавливаться как только получим приемлемый результат, не стремясь получить идеальную модель.
  5. По прошествии времени и накоплению новых сведений нужно повторять цикл – процесс познания бесконечен.

Пример работы

В качестве примера можно в общих чертах рассмотреть процесс анализа рынка недвижимости в г. Москве. Цель – оценка инвестиционной привлекательности проектов. Одна из задач, решаемых при этом, – построение модели ценообразования для жилья в новостройках, другими словами, количественную зависимость цены жилья от ценообразующих факторов. Для типового жилья таковыми, в частности, являются:

  • Местоположение дома (престижность района; инфраструктура района; массовая или точечная застройка; окружение дома (напр. нежелательное соседство с промышленными предприятиями, "хрущевками", рынками и т.д.); экология района (близость к лесопарковым массивам))
  • Местоположение квартиры (этаж – первые и последние этажи дешевле; секция – квартиры в торцевых секциях дешевле; ориентация квартиры по сторонам света – северная сторона дешевле; вид из окон).
  • Тип дома (самая популярная серия П-44Т).
  • Площадь квартиры.
  • Наличие лоджий (балконов)
  • Стадия строительства (чем ближе к сдаче дома, тем выше цена за кв.м).
  • Наличие отделки ("черновая" отделка, частичная отделка, под ключ. Большинство новостроек сдаются с черновой отделкой).
  • Телефонизация дома.
  • Транспортное сообщение (близость к метро, удаленность от крупных магистралей, удобный подъезд, наличие автостоянки около дома (наличие парковочных мест)).
  • Кто продает квартиру ("из первых рук" (инвестор, застройщик) или посредники (риэлтеры). Риэлтеры, как правило, берут за свои услуги – 3-6%).

Это далеко неполный перечень, но и он повергает в уныние. Вот тут-то очень кстати приходится высказывание Р. Фейнмана ("можно идеально изучить характеристики анализируемой системы, стоит только не гнаться за точностью"). Для начала из имеющейся истории продаж мы ограничились данными для одного района Москвы. В качестве входных факторов взяли ограниченный набор характеристик с точки зрения экспертов, очевидно влияющих на продажную цену жилья: серия дома, отделка, этаж (первый, последний, средний), готовность объекта, количество комнат, секция (угловая, обычная), метраж. Выходным значением являлась цена за квадратный метр, по которой продавались квартиры. Получилась вполне обозримая таблица с разумным количеством входных факторов.

На этих данных обучили нейросеть, то есть построили довольно грубую модель. При всей своей приблизительности у нее было одно существенное достоинство: она правильно отражала зависимость цены от учитываемых факторов. Например, при прочих равных условиях квартира в угловой секции стоила дешевле, чем в обычной, а стоимость квартир по мере готовности объекта возрастала. Теперь оставалось ее лишь совершенствовать, делать более полной и точной.

На следующем этапе в обучающее множество были добавлены записи о продажах в других районах Москвы. Соответственно, в качестве входных факторов стали учитываться такие характеристики, как престижность района, экология района, удаленность от метро. Так же в обучающую выборку была добавлена цена за аналогичное жилье на вторичном рынке. Специалисты, имеющие опыт работы на рынке недвижимости, имели возможность в процессе совершенствования модели безболезненно экспериментировать, добавляя или исключая факторы, т. к., напомню, процесс поиска более совершенной модели сводился к обучению нейросети на разных наборах данных. Главное здесь вовремя понять, что процесс этот бесконечен.

Это пример, как нам кажется, довольно эффективного подхода к анализу данных: использование опыта и интуиции специалиста в своей области для последовательного приближения ко все более точной модели анализируемого процесса. Основное требование при этом – наличие качественной информации достаточного объема, что невозможно без системы автоматизации сбора и хранения информации, о чем всегда надо помнить тем, кто серьезно занимается информационным обеспечением бизнеса. Но данная тема выходит за рамки статьи.

Вывод

Описанный подход позволяет решать реальные задачи с приемлемым качеством. Конечно, можно найти у данной методики множество недостатков, но в действительности реальной альтернативы ей нет, разве что отказаться от анализа вообще. Хотя если физики с успехом используют такие методы анализа уже много веков, почему бы не взять его на вооружение и в других областях?