Март 2017

Курсы по искусственному интеллекту и машинному обучению. Март 2017

i

Искусственный интеллект и машинное обучение — одни из самых актуальных тем этого года в IT. Наиболее передовые технологии уже вышли за пределы традиционных алгоритмов на базе правил, позволяя создавать системы, которые могут понимать, учиться, прогнозировать, адаптироваться, и потенциально способны функционировать автономно. itmentor.by сделал подборку мартовских курсов по указанным направлениям.

Intro to Artificial Intelligence, Стэнфордский университет / Udacity

CS 8802, Artificial Intelligence for Robotics: Programming a Robotic Car, Стэнфордский университет / Udacity

Artificial Intelligence for Robotics, Стэнфордский университет / Udacity

Machine Learning, Стэнфордский университет / Coursera

Deep Learning, Google / Udacity

Learning from Data (Introductory Machine Learning course), Калифорнийский технологический институт

Machine Learning: Unsupervised Learning, Брауновский университет / Udacity

Machine Learning for Data Science and Analytics, Колумбийский университет / edX

Data, Analytics and Learning, Техасский университет в Арлингтоне / edX

Intro to Machine Learning, Стэнфордский университет / Udacity

6.S191: Introduction to Deep Learning, Массачусетский технологический институт (MIT)

Principles of Machine Learning, Microsoft / edX

Applied Machine Learning, Microsoft / edX

Machine Learning for Data Analysis, Уэслианский университет / Coursera

Neural Networks for Machine Learning, Торонтский университет / Coursera

Machine Learning 1 — Supervised Learning, Брауновский университет / Udacity

Deep Learning for Natural Language Processing, Оксфордский университет

Reinforcement Learning, Брауновский университет / Udacity

Machine Learning, Брауновский университет / Udacity

6.S094: Deep Learning for Self-Driving Cars, Массачусетский технологический институт (MIT)

Machine Learning for Trading, Технологический институт Джорджии / Udacity

Machine Learning, Технологический институт Джорджии / Udacity.

Виртуальная машина sprintbox.ru

Недавно питерская компания sprinthost.ru запустила услугу по предоставлению быстрых виртуальные машины. Виртуальный сервер на SSD за 30 секунд.

1234

Доступ к машине осуществляется с помощью VNC. Virtual Network Computing (VNC) — удалённый доступ к рабочему столу компьютера, использующий протокол RFB (Remote FrameBuffer, удалённый кадровый буфер). Для это можно использовать программу UltraVNC.

«Под капотом» у виртуальных машин на спринт хосте debian 8 jessie 64 битная, полный root доступ, одно ядро, 2 гига, 32 гига жесткого ssd диска.

123

 

2345На всякий случай проверим какие у нас порты видны снаружи после установки бокса. Команда ping работает на протоколе ICMP, который находиться на сетевом уровне OSI, поэтому воспользуемся программой nmap, которая просканирует TCP порты (TCP транспортный уровень).

123456Поставить гипервизор XenServer не удалось, но сконфигурировать nginx, ssh — удалось. Переустановить операционную систему можно в один клик, выбрав Debian, Ubuntu, Fedora, FreeBSD или CentOS в панели управления хостинга. Поддержка http://sprintbox.ru/ на связи 24/7.

Методы Big Data

i

К концу XXI века объем информации превысит 4,22 йоттабайт (или 4,22*1024 степени). А объем интернет-трафика перешел уже отметку в один зеттабайт и через пару лет составит несколько зетттабайт.

Если количество данных возрастает в геометрической прогрессии, то количество выдаваемых пользователю данных пропорционально уменьшается. Большинство современных российских учреждений работают с объемом не более 100 терабайт, и только 13% из них апеллируют объемами информации выше 500 терабайт.

Сейчас методами Big Data обрабатывается чуть меньше 3% из 23% от всей полезной информации мира. К ним относят анализ с помощью искусственных нейронных сетей, data meaning, машинное обучение (machine learning), пространственный анализ, аналитика прогнозов, моделирование, интеграция данных из различных источников и т.д.

В качестве базового принципа обработки данных указывается горизонтальная масштабируемость, когда данные распределяются на сотни и тысячи вычислительных узлов. Применяются средства NoSQL, MapReduce, Hadoop, язык программирования R для статической обработки данных и работы с ними, Business Intelligence – обработка информации в осмысленную форму и ряд других аппаратных решений.

Сегодня один из самых интересных методов анализа данных является искусственная нейронная сеть. Она организуется по принципу нейронных клеток живого организма. Иерархическая сеть нейронов объединяет работу нейронов высокого уровня с нейронами низкого порядка. Каждый нейрон получает информацию, производит над ней простые вычисления и передает ее дальше. Сигналы или значения, которые передаются на уровень выше усиливаются или изменяются в зависимости от весов, которые приписываются межнейронным связям. После завершения одной эпохи вычисляется единственная усредненная оценка и сеть модифицируется в соответствии с этой ошибкой. Для примера мы можем использовать такие нейросетевые системы, как NeuroShell (Ward Systems Group), BrainMaker (CSS) и OWL (HyperLogic). В них пользователь может задать данные в числовом, символьном виде и в виде изображения.

Другой интересный метод — Data Mining. Это процесс, который обнаруживает неизвестные знания в сырых и необработанных данных. С помощь этого метода разрабатываются программные обеспечения для постановки медицинских диагнозов, обнаружение закономерностей в молекулярной генетике и генной инженерии (такие коды могут содержать сотни, тысячи и более связанных элементов), методы Data Mining находят широкое применение в прикладной химии (неорганической и органической). Можно привести еще много примеров различных областей знания, где методы Data Mining играют ведущую роль. Особенность этих областей заключается в их сложной системной организации. Данные в указанных областях неоднородны, гетерогенны, нестационарны и часто отличаются высокой размерностью. Примеры программ c методом data meaning: rapid miner, weka, knime, NLTK – это программы с открытым исходным кодом и распространяются с помощью лицензий AGPL или GNU.

В денежном выражение в России в 2017 году ожидаются расходы на анализ больших данных в районе 1,1 млрд $ США (по показателям 2016 года это на 0,3 млрд $ США больше). Среди компаний, которые используют технологии Big data: телекоммуникационные компании, ритейл, банки, госсектор, нефтяные компании, энергетические компании. Для этих компаний важно поведение пользователей-клиентов, ведение отчетности, мониторинг работ, создание интеллектуальных систем, мониторинг этих систем и их прогнозирование. С каждым годом количество компаний, использующих технологии и методы Big data увеличиваются. Активно внедряется анализ данных в медицине, молекулярной генетике и генной инженерии, прикладной химии. Большинство специалистов считают «Большие Данные» необходимыми для развития конкурентоспособной стратегии продвижения компании. По статистике Hadoop, после внедрения технологии Больших Данных прибыль в торговых организациях вырастает на 7-10%. Специалисты М.Видео говорят об улучшении логистического планирования после внедрения SAP HANA, также, в результате ее внедрения, подготовка годовой отчетности сократилась с 10 дней до 3, скорость ежедневной загрузки данных сократилась с 3 часов до 30 минут.

 

Тезис опубликован http://www.mai.ru/science/gagarin/

Международная молодёжная научная конференция «Гагаринские чтения»

Международная молодёжная научная конференция «Гагаринские чтения» в текущем году пройдёт 43-й раз. Она приурочена к 100-летию со дня рождения выдающегося конструктора В. П. Мишина. Конференция пройдет в учебных корпусах МАИ в Москве, Байконуре и Ахтубинске.

Конференция организуется в целях развития навыков научно-исследовательской работы и приобретения студентами, аспирантами и молодыми учёными в возрасте до тридцати пяти лет опыта публичных выступлений с научными докладам. «Гагаринские чтения» являются площадкой для обсуждения молодыми учёными научных исследований в области инновационных аэрокосмических технологий.

Научная программа конференции включает в себя работу по десяти направлениям. На секциях будет предложено заслушать доклады студентов, аспирантов, молодых учёных и преподавателей. Особое место в программе конференции занимает направление для школьников, ориентированное на учащихся средних школ, занимающихся научно-техническим творчеством.

В рамках конференции пройдёт отборочный этап Всероссийского инновационного конкурса «УМНИК».

Все участники конференции, которые будут выступать с докладом, становятся участниками конкурса.

Прежде, чем подать заявку, ознакомьтесь с правилами её оформления, уделив особое внимание требованиям к тезисам.

Сборник трудов конференции будет включён в РИНЦ и размещён на сайте электронной библиотеки.

Ждём в числе участников XLIII Международной молодёжной научной конференции «Гагаринские чтения» как постоянных участников, так и новых!