Использование нейлона для создания модели машинного обучения в представлении естественного языка

Моделирование машинного обучения - сложная задача, потому что сначала нам нужно подготовить данные, выполнить проектирование функций, подготовить их к моделированию, а затем создать различные модели машинного обучения, чтобы найти наиболее эффективную модель. Но что, если я скажу вам, что вы можете сделать все это в нескольких строках кода, используя файл JSON? Да, вы правильно прочитали.

Нам просто нужно создать файл JSON, в котором мы определяем целевую переменную и список моделей, в которых вам нужно запускать свои данные. Точно так же мы также можем предварительно обработать данные, манипулировать данными перед их передачей в модель. В файле JSON нам просто нужно передать на естественном языке представление операции, которую нам нужно выполнить.

Nylon - это библиотека Python с открытым исходным кодом, которая легко создает модели машинного обучения в синтаксисе JSON с использованием обычного английского языка. В этой статье мы рассмотрим нейлон и его функции.

Давайте начнем…

Установка необходимых библиотек

Начнем с установки Nylon с помощью pip. Команда, представленная ниже, сделает это.

!pip install nylon

Импорт необходимых библиотек и создание нейлонового объекта

На этом этапе мы импортируем необходимые библиотеки для создания моделей машинного обучения. Перед выполнением любой операции нам просто нужно инициализировать объект и передать путь к данным, с которыми мы будем работать. Здесь я покажу вам, как создать объект и передать в него данные.

from nylon import Polymer
nylon_object = Polymer('/content/diabetes.csv')

Здесь вы можете видеть, что я передал путь к набору данных в качестве параметра объекту.

Создание кода / файла JSON

Мы можем создать файл JSON или код в стиле JSON, который будет использоваться для моделирования. Приведенный ниже код создает модель. Имена моделей могут использоваться как «rf» для случайного леса, «sgd» для градиентного спуска и т. Д.

json_file = {
    "data": {
        "target": "Outcome"
    },
    "preprocessor": {
        "fill": "ALL",
        
    },
    "modeling": {
        "type": ["svms", "neighbors", "rf", "mlp","sgd"]
    }
}

Здесь вы можете видеть, что мы передали целевую переменную, препроцессор и все модели, которые нам нужно создать. Если мы не передадим препроцессор, он позаботится об этом автоматически. Запустив этот код, мы сможем создать файл / код JSON, а после этого мы можем запустить объект нейлона, передав файл JSON, и это запустит модели.

nylon_object.run(json_file)

Анализ результатов

На этом последнем шаге мы проанализируем результаты всех созданных нами моделей и посмотрим, какая из них работает лучше всего.

nylon_object.results

Здесь мы можем проанализировать результаты всех моделей и выбрать наиболее эффективную. Нейлон очень прост в использовании и может быть легко интегрирован в рабочие процессы машинного обучения.

Попробуйте это с разными наборами данных и выполните модели машинного обучения. Если у вас возникнут какие-либо трудности, дайте мне знать в разделе ответов.

Эта статья написана в сотрудничестве с Пиюшем Ингале.

Перед тем, как ты уйдешь

Спасибо за чтение! Если вы хотите связаться со мной, свяжитесь со мной по адресу [email protected] или в моем профиле LinkedIn. Вы можете просмотреть мой профиль Github для различных проектов по науке о данных и руководств по пакетам. Кроме того, не стесняйтесь изучать мой профиль и читать разные мои статьи, связанные с наукой о данных.