2026. február 14. szombat
  • Impresszum
  • Médiaajánlat
  • Szerzői jogok
  • Felhasználói feltételek
  • Adatkezelés
hajdupress.hu
  • Régió
  • Belföld
  • Külföld
  • Sport
  • Kult
  • Üzlet
  • DíszUDvar
  • TrendFórum
  • ALFÖLD TV
  • English
  • Deutsch
  • Română
Nincs találat
Összes találat
hajdupress.hu
  • Régió
  • Belföld
  • Külföld
  • Sport
  • Kult
  • Üzlet
  • DíszUDvar
  • TrendFórum
  • ALFÖLD TV
  • English
  • Deutsch
  • Română
Nincs találat
Összes találat
hajdupress.hu
Home Tech

Szennyezett adat = sötét jövő?

HajduPress Szerző HajduPress
2025/10/08
kategória: Tech
6 0
0
Szennyezett adat = sötét jövő?
FacebookTwitterE-mail

2022. november 30: A ChatGPT launch dátuma – egyesek szerint ez maga az Ítélet Napja, mások úgy vélekednek, hogy egy új technológiai forradalom kezdete. A  valós végeredményt majd később tudjuk értékelni, de az biztos, hogy az évekig (évtizedekig) kutatott és használt machine learning algoritmusok és mesterséges intelligencia ekkor érte el a “lakossági” szintet. Ennek hatásai értelmezhetőek és érezhetőek technológiai, gazdasági, jogi-és erkölcsi, valamint szociálpszichológiai szinten is, meg is vannak erre a megfelelő platformok. Ami viszont érdekes, ugyanakkor alulpozicionált szegmens ezen a területen – még az MI guruk közt is, nemhogy felhasználói szinten – az a szennyezett adat kérdése. Mi ez, hogyan hat ránk, és mi a közös felelősségünk ebben a kérdésben? 

Minden mesterséges intelligencia fejlesztés alapja az adat: bármilyen célt adunk a MI-nak, adatokkal kell betanítanunk. De honnan van az adat, ami alapján tanulnak a kis mesterséges inteligenciák?

Kezdetben volt az internet, mint egy gigantikus adatbázis, az emberiség nagy, közös könyvtára, és kollektív digitális emlékezete. Természetesen, volt itt minden, ami kellett, a felnőtt tartalomtól az összeesküvés elméletekig, de azért a kétes tartalmak minősítése egyfajta közös érték volt. Az első generációs MI-ok innen kezdtek el tanulni. Már a korai időszakban is keringtek bizonyos rémtörténetek fasisztoid és szexista chatbotokról, darkwebre tévedt baby MI-okról, kényszer-shut down-nal végződött kísérletekről, de mégis ezen kísérletek után (vagy ellenére?) a Gemini, a ChatGPT, a DeepSeek, a Veo3 és számos más generatív MI a mindennapjaink részévé váltak. Megközelítőleg 3000 különböző mesterséges intelligencia van most kint “szabadon” a világon. Ez a technológia jelen van a tanulásban, a marketingben, az orvoslásban, a webshop rendszerekben.

Forrás: Gemini

Pandora szelencéje kinyílt, ezt bezárni már nem lehet, emiatt fejlesztői, szabályozói és felhasználói oldalról is felelősség, hogy hogyan bánunk az emberiség új “lakótársával”. A jövő mesterséges intelligenciájának milyensége rajtunk múlik, és mindannyiunk közös felelőssége. 

Az MI által generált contentek, a polarizált, szélsőséges vélemények és megosztó tartalmak korában, olyan adatok transzformálódnak az internetre, amelyek az MI tanítás szempontjából szennyezett adatnak minősülnek (szaknyelven: dirty vagy noisy data). 

Egy MI olyan, mint egy csecsemő: számára “minden vicc új”. Az adatokon keresztül tanulja meg a világot. De, ahogyan egy gyereknél, úgy egy MI-nál is megjelenik a “szülő” felelőssége: mit, mikor, hogyan tanítunk meg neki? Milyen felnőtt válik belőle? 

Az új mesterséges intelligenciák már nem  az internetről, hanem egymástól is tanulnak. A GPT 5.0 például a 3.5. verziótól vett leckéket.

Forrás: ChatGPT

Ezért nagyon nem mindegy, hogy a tanulási alapul szolgáló adat mennyire szennyezett. A dirty data komoly akadályt jelent az MI fejlesztésében, mivel közvetlenül befolyásolja a modellek pontosságát, becsléseit és etikai következményeit (nem is beszélve arról, hogy milyen gazdasági károkat okoz ez az MI fejlesztő cégeknek és azok befektetőinek – ez a gazdasági aspektus egy külön cikket érdemelne egy IT-val foglalkozó szaklapban). 

A mesterséges intelligencia egyre gyorsuló fejlesztése, és egyre szélesebb körű használata mellett kulcsfontosságú szempont a  adatok tisztaságának megőrzése. Az adattisztaság megóvására számos teória és metódus létezik, van ami a “back end-en” , vagyis a háttérben működik, van ami pedig a “frontvonalban”. A háttérben dolgozó rendszerekre jó példa az adatbázis-kezelő rendszerek szintjén bevezetett validációs szabályozás, a folyamatos adat ellenőrzést végző automatizált szoftverek, vagy az anomáliákat észlelő alkalmazások, amelyek már az adatok forrásánál képesek kiszűrni a hibákat.

Ezzel szemben van, ami a “front end-en” vagyis a felhasználók által látott és használt felületeken érvényesül, például a user interfacek-en alkalmazott beviteli ellenőrzések, a kötelező mezők, az előre definiált választási lehetőségek, vagy az intuitív űrlapok, amelyekkel minimalizálható a hibás adatbevitel esélye. Mindkét megközelítés kulcsfontosságú az adatok integritásának és megbízhatóságának fenntartásában. A back end-ben végzett adat megóvás és adattisztítás jellemzően a fejlesztők és a tulajdonosok feladatköre, de számos dolog van, amit  felhasználók szintjén megtehetünk: a felelősséggel végzett tartalomgyártás, és ugyanilyen odafigyeléssel végzett tartalomfogyasztás. Nem mindegy, hogy ki milyen contentet gyárt le, és azt hányan kattintják, osztják tovább, hiszen minden ilyen digitális gesztus formálja az MI-t és ezzel együtt a saját digitális jövőnk tisztaságát is. 

Írta: Kiss Ákos

Megosztás:

  • Share on X (Opens in new window) X
  • Share on Facebook (Opens in new window) Facebook
  • More
  • Share on Reddit (Opens in new window) Reddit
  • Share on Telegram (Opens in new window) Telegram
  • Share on WhatsApp (Opens in new window) WhatsApp

Like this:

Like Loading...

Related

Tags: ChatGPTjövőMesterséges Intelligenciaszenyezett adattanulás
Előző Cikk

Román embercsempészeket fogtak el Hajdú-Biharban

Következő Cikk

Timothée Chalamet bezsákolhatja első Oscar-díját: álló ovációval fogadták legújabb filmjét

KapcsolódóCikk

A digitális világ veszélyeire hívták fel az Informatikai Kar hallgatóinak figyelmét
Belföld

A digitális világ veszélyeire hívták fel az Informatikai Kar hallgatóinak figyelmét

2026.02.11.
Közelebb a pillanathoz: a Samsung Galaxy is segített megörökíteni a 2026-os milánó-cortinai játékok megnyitó ünnepségét
Színes

Közelebb a pillanathoz: a Samsung Galaxy is segített megörökíteni a 2026-os milánó-cortinai játékok megnyitó ünnepségét

2026.02.09.
close up of a kid holding a game controller
Belföld

Szeretsz videojátékozni? Árt vagy használ?

2026.02.08.
Következő Cikk
Timothée Chalamet bezsákolhatja első Oscar-díját: álló ovációval fogadták legújabb filmjét

Timothée Chalamet bezsákolhatja első Oscar-díját: álló ovációval fogadták legújabb filmjét

Hozzászólások

CIKKAJÁNLÓ

Két férfi rágyújtotta a házat szomszédaira Hajdúböszörményben

Két férfi rágyújtotta a házat szomszédaira Hajdúböszörményben

2026.02.11.
Összehangolt rendőrségi akció Hajdúhadházon: 36 ember állítottak elő

Összehangolt rendőrségi akció Hajdúhadházon: 36 ember állítottak elő

2026.02.09.
Drogbiznisz miatt bezárattak egy debreceni autókereskedést – Videóval

Drogbiznisz miatt bezárattak egy debreceni autókereskedést – Videóval

2026.02.06.
Kábítószerrel megpakolt zsákolt találtak rendőrök Derecske mellett – Videóval!

Kábítószerrel megpakolt zsákolt találtak rendőrök Derecske mellett – Videóval!

2026.02.12.

ROVATOK

  • AlföldTv
  • Életmód
  • Üzlet
  • Belföld
  • DíszUDvar
  • Deutsch
  • Egyéb kategória
  • English
  • gazdaság
  • Könyvespolc.On
  • Külföld
  • Kult
  • Régió
  • Română
  • Sport
  • Színes
  • Tech
  • TrendFórum
  • Tudomány

KÖVESS MINKET

NÉPSZERŰ

  • Elhunyt Babik Barbara televíziós szerkesztő-műsorvezető

    Elhunyt Babik Barbara televíziós szerkesztő-műsorvezető

    9418 Megosztás
    Share 3767 Tweet 2355
  • Lángolt egy hotel Nyíradony- Tamásipusztában

    8851 Megosztás
    Share 3540 Tweet 2213
  • Húsevő baktérium végezhetett Vadász Zsolttal

    3279 Megosztás
    Share 1312 Tweet 820
  • Meghalt Varga Zita, a Debreceni Egyetem GDPR Központ vezetője

    3223 Megosztás
    Share 1289 Tweet 806
  • Tizenketten tűntek el Debrecenben a múlt héten

    3150 Megosztás
    Share 1260 Tweet 788
hajdupress.hu

HajduPress - Lapozz a Hírekben!

Kövessen minket a közösségi médiában:

Legfrissebb hírek

  • Laborba viszik a Temuról, Sheinről és AliExpressről rendelt termékeket
  • Két hét múlva lejár az érvényessége az ingyenes lakossági parkolásra
  • Február 21-én indul a gamer ünnep Debrecenben
  • Török Ádám eladja a balatoni családi házát
  • Melléképület égett Hajdúhadházon
  • Videó: így érkezett meg a két új királypingvin a Nyíregyházi Állatparkba
  • Dinamikus struktúrák – Az MNB letéti gyűjteményt adományozott a vidéki múzeumoknak

Rovatok

  • AlföldTv
  • Életmód
  • Üzlet
  • Belföld
  • DíszUDvar
  • Deutsch
  • Egyéb kategória
  • English
  • gazdaság
  • Könyvespolc.On
  • Külföld
  • Kult
  • Régió
  • Română
  • Sport
  • Színes
  • Tech
  • TrendFórum
  • Tudomány

Iratkozzon fel hírlevelünkre!

Iratkozzon fel levelezőlistánkra, hogy elsőként értesüljön legfrissebb híreinkről!

  • Impresszum
  • Médiaajánlat
  • Szerzői jogok
  • Felhasználói feltételek
  • Adatkezelés

HajduPress © 2025 Minden jog fenntartva.

Nincs találat
Összes találat
  • Régió
  • Belföld
  • Külföld
  • Sport
  • Kult
  • Üzlet
  • Díszudvar
  • Trendfórum
  • ALFÖLD TV
  • English
  • Deutsch
  • Română

Welcome Back!

Login to your account below

Forgotten Password?

Create New Account!

Fill the forms bellow to register

All fields are required. Log In

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

Discover more from hajdupress.hu

Subscribe now to keep reading and get access to the full archive.

Continue reading

 

Loading Comments...
 

    %d