Машинное обучение доступным языком [Елена Капаца] (pdf) читать постранично

-  Машинное обучение доступным языком  [Ознакомительный фрагмент] 1.21 Мб, 25с. скачать: (pdf) - (pdf+fbd)  читать: (полностью) - (постранично) - Елена Капаца

Книга в формате pdf! Изображения и текст могут не отображаться!


 [Настройки текста]  [Cбросить фильтры]

Елена Капаца
Машинное обучение
доступным языком

«Автор»
2023

Капаца Е.
Машинное обучение доступным языком / Е. Капаца — «Автор»,
2023

ISBN 978-5-0060-1962-1
Краткий гайд для новичков по машинному и глубокому обучению с разбором
кода. Здесь вы найдете необходимый минимум по предмету, истолкованный
языком, понятным школьнику. Некоторые разделы написаны с помощью
chatGPT. По прочтении вы избавитесь от страха перед технологией и освоите
базовый инструментарий подготовки данных, их загрузке в модель и ее
донастройки. Подходит студентам технических специальностей.

ISBN 978-5-0060-1962-1

© Капаца Е., 2023
© Автор, 2023

Е. Капаца. «Машинное обучение доступным языком»

Содержание
Введение
Машинное обучение
Данные
Классическая таблица
Текстовый документ
Графы
Аудиодорожки
Временной ряд
Последовательные данные
Пространственные данные
Изображения
ETL
Облачные вычисления
DWH
EDA
Удаление дубликатов
Обработка пропусков
Конец ознакомительного фрагмента.

5
8
9
9
10
10
11
11
12
13
14
16
16
18
20
23
24
25

4

Е. Капаца. «Машинное обучение доступным языком»

Елена Капаца
Машинное обучение доступным языком
Введение
Приступая к изучению машинного обучения, студенты легко и непринужденно добиваются… запутанности. Пара-тройка непонятных терминов или неясностей при расчете – и все:
мозг теряет нить и начинает воспринимать “по диагонали”. Продираться через непонятное
довольно трудоёмко. Не каждый день у нас есть ресурс догугливать непонятное. Не каждый
запрос в Google даст лаконичный понятный ответ.
Моя задача – описать детали этой мозаики языком, понятным старшекласснику. Я намеренно буду избегать формул, потому что знаю: каждая из них сокращает число читателей.
Однако в книге будет код, и он будет расширенно комментироваться.
Минимальное требование к читателю – знание основ Python. Книга фокусируется на
машинном обучении, и потому останавливаться на терминах вроде “переменной” и “списка”
я не буду.
Если вы чувствуете, что пересиливаете себя при чтении, лучше сделайте перерыв. В Data
Science будет предостаточно информации, однако в этой книге я постаралась собрать повторяющиеся в работе термины. Добиться их понимания особенно важно.
Некоторые главы будут базироваться на полноценных моделях и скриптах. В машинном
обучении принято использовать так называемые ноутбуки – наборы ячеек с исполняемыми
кусками кода:

5

Е. Капаца. «Машинное обучение доступным языком»

Все используемые в дальнейшем ноутбуки можно открыть, запустить и скопировать себе
для дальнейших экспериментов. Инструменты ML имеют свойство совершенствоваться, а это
значит, что спустя 3-4 года после выхода книги некоторые участки кода вам придется отлаживать с помощью поисковиков.
Машинное обучение – это абстрактная концепция. Ее основные компоненты стоит описывать просто, пускай даже это вызовет раздражение профессионалов. Эта книга – серия
взаимосвязанных статей. Их основная цель – осветить основные и популярные термины во
взаимосвязи друг с другом. Ключевые понятия при первом упоминании я буду дополнять
англоязычным термином. Так вы всегда сможете с легкостью отыскать дополнительные материалы.
Немалое влияние на меня оказал бестселлер Максима Ильяхова и Людмилы Сарычевой
“Пиши, сокращай”. Потому эта книга написана в информационном стиле 1 и изобилует упрощениями. Если вы сохраните по прочтении ощущение удобства чтения и желание взбираться
на эту познавательную гору дальше, то моя цель достигнута.
1

Информационный стиль – инструмент для очистки текста от лишнего, для обнажения самой сердцевины текста.

6

Е. Капаца. «Машинное обучение доступным языком»

Вы всегда можете “напитаться” полноценными зубодробительными статьями на моем
сайте helenkapatsa.ru.
Приятного чтения! Я буду рада вашим предложениям и фидбэку в целом
(kapatsahelen@gmail.com). Вы также можете запросить PDF-версию с цветовой разметкой кода.
Это упростит восприятие материала.

7

Е. Капаца. «Машинное обучение доступным языком»

Машинное обучение
Что же это такое? Машинное обучение (machine learning, ML) – наука о том, как заставить компьютеры выполнять объемную вычислительную задачу без явного программирования.
Классическим алгоритмам дают точные и полные правила для выполнения задачи, моделям Машинного обучения – данные. Мы говорим, что «подгоняем модель к данным» или
«модель обучена на данных».
Проиллюстрируем это на простом примере. Предположим, мы хотим спрогнозировать
цену дачного дома на основе:
• площади
• размера придомового участка
• количества комнат.
Мы могли бы попытаться построить классический алгоритм, который решает эту проблему. Этот алгоритм возьмет три вышеупомянутых признака (feature) и выдаст прогнозируемую цену на основе явного правила. Но на практике эта формула часто неочевидна.
Однако мы