sql >> Databáze >  >> RDS >> Database

Nestrukturovaný obsah:Nevyužitý zdroj paliva pro umělou inteligenci a strojové učení

Autor Alex Welsh , Vice President, Analytics Practice, Ephesoft

Vybrali byste si, kam pojedete na dovolenou, kdybyste měli přístup pouze k 10 až 20 procentům recenzí a informací na cestovatelském webu? Pokud tak učiníte, pravděpodobně vás čeká nezapomenutelný výlet, ale z důvodů, které se vám nemusí líbit. Vládní organizace a podniky – od výroby po pojišťovny a zdravotnictví po bankovnictví – však rozhodují stejným způsobem. A dělají to už léta. Dívají se na snadné informace, které mohou získat ze strukturovaných dat, a přitom ignorují svá nestrukturovaná data, o kterých se Deloitte domnívá, že mohou tvořit 80 až 90 procent obsahu generovaného globálně, což z nestrukturovaných dat činí obrovský zdroj nevyužité hodnoty.

Naštěstí pokroky v AI (Artificial Intelligence) a strojovém učení nyní umožňují a cenově dostupné prozkoumání a nalezení smyslu v obrovském množství nestrukturovaných dat získaných z video a audio souborů, e-mailů, protokolů, příspěvků na sociálních sítích a dokonce i oznámení. ze zařízení internetu věcí (IoT). Všechna tato data mohou přinést obrovské výhody, například když se použijí k automatizaci úloh, které jsou manuálně náročné a často se velmi opakují. Jedním z úkolů je například dávat pozor na varovné signály:specifická kritéria nebo chování, které mohou naznačovat, že něco není v pořádku, a musí být rychle přijata nápravná opatření. Podívejme se na několik případů z různých odvětví.

Co takhle pojistná událost, která se navenek jeví v pořádku, ale zaslouží si prošetření, nebo uchazeč o zaměstnání, který může skrývat informace? A co zásilka farmaceutických produktů podléhajících rychlé zkáze, které nemusely být chlazeny po část jejich cesty, nebo smlouva, která může být v rozporu se zákony dané země nebo porušuje stávající dohodu s jinou společností? Důležité je, že červená vlajka označuje problémy, které, pokud nebudou zaškrtnuté, mohou způsobit velké škody.

Umělá inteligence je ohromně hladová po datech

Jak AI a strojové učení umožňují efektivnější a efektivnější analýzu dat? Prostřednictvím předávání dat. Tím, že model strojového učení uvádí příklady dobrých a špatných transakcí, učí se rozlišovat mezi těmito dvěma typy. A čím více dat model strojového učení zpracovává, tím více tyto lekce posiluje a zvyšuje přesnost.

I když tedy umělá inteligence a strojové učení dělají velké pokroky, podniky a další organizace je musí dohnat. Představte si to takto:data jsou jako palivo. Potřebujeme ho, aby posílil naše myšlení, abychom mohli dělat moudrá rozhodnutí. Ale vytěžili jsme všechny snadné věci, strukturovaná data, která přicházejí v pěkných a úhledných balíčcích. Zde se však analogie s palivem rozpadá:I když nám další galon plynu umožní ujet dalších 20 až 30 mil, čím více údajů vložíme, umožňuje nám činit výrazně lepší a přesnější rozhodnutí – nejen dalších 20 až 30 kilometrů. -hodnota lichých mil – a aby byly ještě rychlejší.

Přesto tak dlouho zůstala obrovská část našich dat, našich nestrukturovaných dat, nevyužita, protože byla příliš drahá a příliš složitá na přístup a zpracování. A ačkoli to již neplatí, protože jsou k dispozici nové technologie pro shromažďování a analýzu nestrukturovaných dat, mnoho lidí v podnikání a dalších organizacích tyto pokroky přehlédlo.

Kde jsou chytré peníze

International Data Corporation (IDC) předpovídá, že do roku 2020 organizace, které analyzují jak strukturovaná, tak nestrukturovaná data – tedy všechna relevantní data – a poskytují použitelné informace, dosáhnou dalších 430 miliard dolarů v nárůstu produktivity oproti svým konkurentům, kteří takovou analýzu dat neprovádějí. A podniky, které to chápou, nečekají do roku 2020. Vedoucí pracovník nadnárodní pojišťovací společnosti se sídlem v Německu uvádí nestrukturovaná data jako jejich největší riziko. Rozumí příslušným číslům a pracují na tom, aby je nezaskočili tím, že sepíší pojistné smlouvy, které je vystaví závazkům, kterým se mohli vyhnout.

Kombinovaná síla velkých dat, AI a strojového učení může usnadnit zpracování informací souvisejících s ještě složitějšími výzvami. Banky a další organizace mohou například přesněji a rychleji odhalovat podvody, daňové úniky, praní špinavých peněz a další schémata těžbou dříve nezpracovaných nestrukturovaných dat. To jim umožňuje zachytit a zastavit případy podvodů a zneužití a také se vyhnout mnoha falešným pozitivním zjištěním, ke kterým může dojít, když se spoléhají pouze na strukturovaná data. Dohody o obchodním financování, včetně smluv a více zdrojů dat, mezi zeměmi nebo společnostmi lze také prozkoumat, aby se zjistilo, zda existují podvody nebo nespravedlnosti, ať už jsou úmyslné nebo ne.

Umělá inteligence a strojové učení navíc mohou bankám a dalším druhům podniků pomoci lépe identifikovat a ověřit identitu jejich klientů prostřednictvím automatizovaných postupů Poznej svého zákazníka (KYC). Takové postupy mohou pomoci zabránit tomu, aby byly záměrně či neúmyslně použity k praní špinavých peněz, a také pomoci odvrátit úplatkářství a jiné formy korupce. Postupy KYC také mohou podnikům umožnit lépe porozumět finančním jednáním a potřebám svých zákazníků a také jim pomoci obezřetněji řídit rizika. Mezi další výhody patří urychlení doby potřebné k získání příjmů při přijímání nových zákazníků, díky čemuž KYC není další vynaložené náklady, ale místo toho je zdrojem zisku.

AI a strojové učení mohou zvýšit vaši konkurenceschopnost

Se všemi výhodami získanými prostřednictvím AI a strojového učení – a pokroky v technologii používané ke zpracování strukturovaných a nestrukturovaných dat – je čas, aby více podniků a organizací využilo největší dostupný zdroj informací:svá vlastní nestrukturovaná data.

O autorovi

Alex Welsh vede globální analytickou praxi společnosti Ephesoft. Je zkušeným obchodním ředitelem, projektovým manažerem a podnikatelem s vášní pro řešení kritických problémů zákazníků pomocí inovativních, nákladově efektivních technologických řešení.


  1. Numerické funkce v Oracle (úplný seznam)

  2. Časový rozdíl SQL mezi dvěma daty má za následek hh:mm:ss

  3. Jak vložit výsledky uložené procedury do dočasné tabulky na serveru SQL Server

  4. chyba běhu:java.lang.ClassNotFoundException:com.mysql.jdbc.Driver