Adatbányászati módszerek alkalmazás a mezőgazdaságban – a gépi tanulás felhasználási lehetőségei

Farkas Gábor – Magyar Péter – Molnár András – Zubor-Nemes Anna

Kulcsszavak: adatbányászat, mátrixfaktorizáció, gépi tanulás, agrárdigitalizáció, tesztüzemi adatok (FADN), C55

Az agrárdigitalizáció mind szélesebb körű térnyerésével több egymással szorosan összefüggő kérdés is felmerül. A mind nagyobb mennyiségben rendelkezésre álló adatok automatikusan több információt biztosítanak? A hagyományos elemzési módszerek mellett és/vagy helyett milyen új módszerek alkalmazása válik szükségszerűvé? A cikk keretében arra kerestük a választ, hogy a NAIK Agrárgazdasági Kutatóintézet (NAIK AKI) által gyűjtött tesztüzemi (FADN) adatok esetében milyen kérdéseknél lehet módszerként alkalmazni a mátrixfaktorizációs (MF) modellt. Arra az eredményre jutottunk, hogy egy jól felépített MF-modell hatékonyan képes tanulni ellenőrzött és megbízható adatokon. Fontos tanulság, hogy a hiányzó adatok jellemzően szisztematikusak, azaz a hiányzó elemek közel minden felhasználónál jelentkeznek. Két, mezőgazdasági adatbázisok esetén gyakran előforduló felhasználási lehetőséget azonosítottunk: egyrészt lehetőség van hiányzó adatok becslésére, másrészt alkalmas lehet adatszolgáltatás ellenőrzésére. Az eredmények alapján további adatkörök esetében is érdemes megvizsgálni a módszer alkalmazása által elérhető eredményeket. Végezetül fontos hangsúlyozni, hogy a módszer alkalmazhatóságának fontos feltétele a mezőgazdasági összefüggések figyelembevétele és a megválaszolandó kérdés MF-problémaként történő meghatározása.

Teljes cikk