ML.NET Na Start - Jak Zacząć Przygodę z Machine Learning w .NET

Machine Learning (uczenie maszynowe) to jeden z najgorętszych trendów we współczesnym IT. Choć wiele osób kojarzy ML głównie z językiem Python, warto wiedzieć, że ekosystem .NET również oferuje świetne narzędzia do budowania i wdrażania modeli ML. Głównym rozwiązaniem jest tu ML.NET, czyli otwartoźródłowy i wieloplatformowy framework od Microsoftu, który pozwala programistom .NET tworzyć własne modele uczenia maszynowego i integrować je bezpośrednio z aplikacjami napisanymi w C#. Innymi słowy, korzystając z ML.NET, możemy eksplorować świat AI bez potrzeby przechodzenia na inny ekosystem czy język programowania.

W dzisiejszym artykule:
• Dowiesz się, czym jest ML.NET i dlaczego warto się nim zainteresować.
• Poznasz podstawowe etapy tworzenia modelu uczenia maszynowego w .NET.
• Zobaczysz przykładowy kod w C#, który ułatwi Ci stawianie pierwszych kroków z ML.NET.

ML.NET Na Start - Jak Zacząć Przygodę z Machine Learning w .NET

Czym jest ML.NET?

ML.NET to framework machine learning stworzony z myślą o programistach .NET. Jest on w pełni open source i działa na wszystkich popularnych platformach (Windows, Linux, macOS). W praktyce ML.NET umożliwia tworzenie modeli ML bezpośrednio w aplikacjach .NET, bez konieczności przełączania się na Pythona lub R. Oto, co to oznacza w codziennej pracy:

• Jeden ekosystem – Możesz wykorzystywać uczenie maszynowe, nie opuszczając dobrze znanego świata .NET. Kod od back-endu po front-end (np. aplikacje Blazor) i logikę ML napiszesz w jednym języku.

• Znane narzędzia – Do pracy z ML.NET użyjesz tego, co już znasz, np. Visual Studio lub VS Code. Microsoft dostarcza nawet graficzne narzędzie Model Builder, dzięki któremu podstawowy model stworzysz kilkoma kliknięciami (pod spodem korzysta ono z AutoML). Jest także narzędzie CLI dla preferujących wiersz poleceń.

• Bogata biblioteka algorytmów – ML.NET oferuje wiele gotowych algorytmów i metod ML: od klasyfikacji i regresji, przez klasteryzację i wykrywanie anomalii, po rozwiązania wykorzystujące głębokie uczenie (np. w integracji z ONNX czy TensorFlow). Innymi słowy, znajdziesz tu narzędzia do typowych zadań, takich jak przewidywanie wartości liczbowych, kategoryzacja tekstu, rekomendacje czy analiza obrazów.

• Integracja z .NET – Model stworzony w ML.NET z łatwością wkomponujesz w swoją aplikację. Takie modele mogą zasilać np. funkcjonalności rekomendacyjne w sklepie internetowym, moduły wykrywania oszustw w aplikacji finansowej czy systemy analizy sentymentu opinii klientów – wszystko to w obrębie jednej aplikacji .NET.

Typowy przepływ pracy w ML.NET

Skoro wiemy, czym jest ML.NET, przyjrzyjmy się, jak wygląda tworzenie modelu ML w praktyce. Proces ten można opisać w kilku krokach:

1. Zebranie danych – Na początku potrzebujesz danych treningowych. Mogą to być pliki CSV, baza danych SQL, plik JSON, a nawet dane w chmurze. Ważne, by dane zawierały przykłady, na podstawie których model będzie się uczył (np. historyczne dane sprzedaży, przykłady maili oznaczonych jako spam lub nie-spam, itp.).

2. Zdefiniowanie schematu danych – Określasz, jakie kolumny lub pola w danych wejściowych będą cechami (features), a które pole jest docelową etykietą (label), którą model ma przewidywać. Przykładowo, dla detekcji spamu cechą będzie treść wiadomości, a etykietą informacja, czy to spam. Tworzysz też klasę danych w C#, która odwzorowuje ten schemat (to ułatwia wczytywanie danych do ML.NET).

3. Zbudowanie i wytrenowanie modelu – Korzystając z ML.NET, konstruujesz tzw. pipeline, czyli sekwencję transformacji danych oraz algorytm ML, który będzie trenowany. W pipeline można np. dodać etap konwersji tekstu na cechy numeryczne, normalizację danych liczbowych, a na końcu wybrać algorytm odpowiedni do zadania (np. regresję logistyczną dla klasyfikacji binarnej, drzewa decyzyjne, sieć neuronową itp.). Następnie przekazujesz dane treningowe do pipeline'u, aby wytrenować model – ML.NET dopasuje parametry modelu do dostarczonych danych.

4. Ocena modelu – Zanim użyjesz modelu w prawdziwym świecie, warto sprawdzić, jak dobrze się spisuje. ML.NET umożliwia ocenę jakości modelu na danych testowych lub walidacyjnych. Możesz sprawdzić metryki takie jak dokładność (accuracy), precyzja, czułość (recall) czy błąd średniokwadratowy – zależnie od rodzaju zadania. Dzięki temu wiesz, czy model nadaje się do użycia, czy wymaga poprawek (np. więcej danych, inny algorytm lub lepsze dostrojenie).

5. Wykorzystanie modelu (predykcja) – Gdy model jest już wytrenowany i sprawdzony, możesz go użyć do przewidywania wyników dla nowych, nieznanych wcześniej danych. W ML.NET tworzysz tzw. PredictionEngine (silnik predykcji) lub korzystasz bezpośrednio z modelu, aby na podstawie nowych danych uzyskać prognozy. Np. dla nowej wiadomości e-mail model zwróci przewidywanie, czy to spam, czy nie.

6. Wdrożenie modelu – Ostatnim krokiem jest wdrożenie, czyli wykorzystanie modelu w docelowej aplikacji. Model wytrenowany w ML.NET można zapisać do pliku (np. .zip) i następnie załadować go w aplikacji .NET (np. przy starcie aplikacji). Możesz też trenować i używać modelu w locie, w zależności od potrzeb. Warto podkreślić, że modele ML.NET łatwo wdrożyć w środowisku chmurowym Azure czy jako część aplikacji desktopowej, mobilnej, a nawet IoT, w końcu to zwykła biblioteka .NET.

Uwaga: Jeśli dopiero zaczynasz i powyższe kroki wydają Ci się złożone - bez obaw. Narzędzia takie jak wspomniany Model Builder potrafią zautomatyzować większość z nich. Wystarczy wskazać dane i wybrać typ problemu, a Model Builder sam dobierze algorytm i wytrenuje wstępny model (korzystając z AutoML). To świetny sposób, by szybko zobaczyć rezultaty bez pisania kodu od zera.

Przykładowy kod z ML.NET

Omówienie teorii jest ważne, ale najlepiej zobaczyć wszystko w praktyce. Poniżej znajdziesz uproszczony przykład klasyfikacji tekstu z użyciem ML.NET. Załóżmy, że chcemy zbudować prosty model analizy sentymentu. Będzie on oceniał, czy dana opinia (tekst) jest pozytywna, czy negatywna. Taki model to przykład klasyfikacji binarnej (dwie klasy: pozytywna lub negatywna).

using Microsoft.ML;
using Microsoft.ML.Data;

/* 1. Inicjalizacja kontekstu ML */
var mlContext = new MLContext();

/* 2. Wczytanie danych treningowych z pliku CSV do postaci IDataView */
IDataView dataView = mlContext.Data.LoadFromTextFile<SentimentData>(
    path: "opinie.csv",
    hasHeader: true,
    separatorChar: ',');

/* 3. Zbudowanie pipeline'u przetwarzania i uczenia */
var pipeline = mlContext.Transforms.Text.FeaturizeText(
                    outputColumnName: "Features",
                    inputColumnName: nameof(SentimentData.Text))
                .Append(mlContext.BinaryClassification.Trainers.LbfgsLogisticRegression(
                    labelColumnName: "Label",
                    featureColumnName: "Features"));

/* 4. Trenowanie modelu */
var model = pipeline.Fit(dataView);

/* 5. Ocena modelu na danych treningowych (dla uproszczenia) */
var predictions = model.Transform(dataView);
var metrics = mlContext.BinaryClassification.Evaluate(predictions, labelColumnName: "Label");
Console.WriteLine($"Dokładność: {metrics.Accuracy:P2}");

/* 6. Użycie wytrenowanego modelu do predykcji */
var predictionEngine = mlContext.Model.CreatePredictionEngine<SentimentData, SentimentPrediction>(model);
var sampleOpinion = new SentimentData { Text = "To był fantastyczny film, pełen emocji!" };
var result = predictionEngine.Predict(sampleOpinion);
Console.WriteLine($"Opinia pozytywna: {result.PredictedLabel}");

W powyższym kodzie dzieje się kilka istotnych rzeczy:
• MLContext – to punkt początkowy biblioteki ML.NET. Zapewnia kontekst dla wykonywania operacji ML (wczytywanie danych, trenowanie modeli, itp.).
• LoadFromTextFile<SentimentData> – wczytuje dane z pliku CSV i mapuje je na klasę SentimentData. W naszej klasie SentimentData zakładamy np., że ma właściwość Text oraz Label (gdzie Label to bool określający czy opinia jest pozytywna). Atrybuty [LoadColumn] w klasie pomagają zmapować kolumny z pliku na pola klasy.
• FeaturizeText – przekształca tekst (naszą kolumnę z opinią) na cechy numeryczne. Dzieje się to automatycznie – tekst zostaje zamieniony na wektor liczb (reprezentacja typu Bag-of-Words lub inne techniki), zrozumiały dla algorytmu ML.
• LbfgsLogisticRegression – to wybrany algorytm uczenia maszynowego (trener) do klasyfikacji binarnej. W tym przypadku trenujemy model regresji logistycznej, który nauczy się przewidywać etykietę Label na podstawie cech Features. ML.NET oferuje wiele różnych algorytmów; regresja logistyczna jest tylko jednym z nich, często stosowanym do zadań typu tak/nie (spam lub nie spam, opinia pozytywna lub negatywna itp.).
• Evaluate – dokonuje oceny jakości modelu. Tutaj dla uproszczenia wykorzystujemy te same dane treningowe do oceny, a w wyniku wypisujemy dokładność (Accuracy) modelu. W praktyce lepiej użyć osobnego zbioru testowego, ale na początek warto wiedzieć, że takie metryki są łatwo dostępne.
• Predict – używa wytrenowanego modelu do przewidywania wyniku dla nowej próbki danych. Tworzymy pojedynczy przykład SentimentData z przykładowym tekstem i otrzymujemy przewidywanie PredictedLabel w obiekcie SentimentPrediction. W naszym założeniu PredictedLabel = true mogłoby oznaczać opinię pozytywną.

Jak widać, kod w ML.NET jest czytelny i pozostaje w pełni w C#. Taki model można dalej rozbudowywać albo zapisać go na dysk i załadować w innej aplikacji .NET do wykonywania predykcji.

Dlaczego warto poznać ML w .NET?

Skoro istnieje wiele innych platform ML (TensorFlow, scikit-learn, PyTorch…), to dlaczego warto zainteresować się ML.NET? Oto kilka powodów z perspektywy programisty .NET:

1. Jeden język – wiele zastosowań: Możesz tworzyć całą aplikację (back-end, front-end i moduły ML) używając wyłącznie C#/.NET. Nie musisz mieszać technologii ani uczyć się nowego języka od podstaw. Wykorzystujesz to, co już znasz, co znacząco skraca czas nauki i wdrożenia.

2. Świetna integracja z ekosystemem Microsoft: ML.NET doskonale współpracuje z resztą technologii .NET oraz usługami chmurowymi Azure. Wdrożenie wytrenowanego modelu np. jako usługi w Azure czy wewnątrz istniejącej aplikacji serverless jest proste, ponieważ model to po prostu biblioteka .NET.

3. Wysoka wydajność i niezawodność: Kod napisany w .NET jest kompilowany i zoptymalizowany, co przekłada się na dobrą wydajność modeli ML.NET w środowisku produkcyjnym. Sam framework jest intensywnie rozwijany pod kątem optymalizacji, a co ważne – został sprawdzony w boju. ML.NET jest już wykorzystywany w dużych produktach Microsoftu (m.in. w Power BI czy Windows Defender), co potwierdza jego skuteczność na dużą skalę.

4. Oszczędność czasu dla .NET developerów: Jeśli znasz dobrze .NET, nauka ML.NET będzie dla Ciebie o wiele łatwiejsza niż zgłębianie od zera np. całego ekosystemu Pythona. Możesz szybko zaadaptować istniejącą wiedzę (np. o LINQ, pracy z danymi, JSON, itd.) do rozwiązań machine learning.

5. Wsparcie narzędzi i AutoML: ML.NET udostępnia narzędzia, które automatyzują wiele zadań – jak Model Builder czy ML.NET CLI. Dzięki AutoML potrafią one same przetestować różne algorytmy i wybrać najlepszy model dla Twojego problemu. To ogromna pomoc na starcie, pozwalająca skupić się na wyniku biznesowym zamiast na żmudnej konfiguracji modeli.

Kluczowe zastosowania ML.NET

Jakie konkretnie problemy możesz rozwiązywać za pomocą ML.NET? Oto kilka typowych zastosowań uczenia maszynowego, do których ML.NET dostarcza gotowe algorytmy i przykładów:

• Klasyfikacja: Kategoryzowanie danych do określonych klas. Przykłady to filtracja spamu (email spam/nie-spam), analiza opinii (pozytywna/negatywna), klasyfikacja obrazów (np. rozpoznawanie, czy zdjęcie przedstawia kota czy psa) itp.

• Regresja: Przewidywanie wartości liczbowych. Np. prognozowanie cen domów na podstawie cech nieruchomości, przewidywanie sprzedaży w sklepach, szacowanie zużycia energii.

• Klasteryzacja: Wykrywanie grup podobnych obiektów bez wcześniejszych etykiet. Na przykład segmentacja klientów na grupy o podobnych cechach (do celów marketingowych) albo grupowanie produktów według wzorców zakupowych.

• Wykrywanie anomalii: Identyfikacja nietypowych zdarzeń lub danych odstających od normy. To może służyć do wykrywania fraudów (np. podejrzane transakcje kartą), monitorowania kondycji systemów (nietypowe spadki/wzrosty w metrykach) czy kontroli jakości (wyłapywanie wadliwych produktów na taśmie produkcyjnej).

Oczywiście to tylko część możliwych zastosowań. ML.NET jest na tyle uniwersalne, że z powodzeniem zaimplementujesz także system rekomendacji produktów, analizę tekstu (np. wykrywanie nazw własnych w tekście), a nawet bardziej zaawansowane scenariusze z użyciem sieci neuronowych (dzięki integracji z bibliotekami pokroju ONNX czy TensorFlow). Wszystko zależy od Twojej kreatywności i danych, którymi dysponujesz.

Podsumowanie

Machine Learning w C#/.NET jest jak najbardziej możliwy i wcale nie musi ustępować popularnym rozwiązaniom opartym na Pythonie. Dzięki bibliotece ML.NET możemy tworzyć modele uczenia maszynowego, które bezproblemowo integrują się z aplikacjami .NET. To świetna wiadomość dla programistów, którzy nie chcą porzucać ulubionych narzędzi, a jednocześnie chcą skorzystać z możliwości, jakie daje sztuczna inteligencja. ML.NET obniża próg wejścia do świata ML dla .NET developerów, oferując znajome środowisko, bogatą funkcjonalność i stale rozwijane wsparcie ze strony Microsoftu i społeczności.

Jeśli więc masz ochotę zagłębić się bardziej w tematykę AI i ML w .NET, rozważ dołączenie do mojego pełnego szkolenia online Szkoła AI w C#/.NET. Dowiesz się w nim krok po kroku, jak tworzyć nowoczesne aplikacje z elementami sztucznej inteligencji – od integracji usług Azure AI, przez wykorzystanie modeli OpenAI, aż po budowanie własnych modeli ML w ML.NET. To może być Twój następny krok w drodze do opanowania AI jako programista .NET.

Blog Dla Programistów C#/.NET