7 крокаў да машыннага навучання: як падрыхтавацца да аўтаматызаванага будучыні

Выява: Sdecoret / Shutterstock

Лічбавая эканоміка, якая становіцца ўсё часцей, патрабуе ад членаў праўлення і кіраўнікоў, каб яны добра разумелі хутка змяняецца лічбавы пейзаж. Штучны інтэлект (AI), безумоўна, з'яўляецца важным удзельнікам. Кампаніі, якія хочуць падрыхтавацца да аўтаматызаванага будучыні, павінны глыбока разумець ІІ. Аднак AI - гэта парасонавы тэрмін, які ахоплівае некалькі дысцыплін, кожная з якіх уплывае на кампанію крыху па-іншаму.

Калі мы паглядзім на штучны інтэлект, яго можна падзяліць на тры розныя сферы:

  1. Робататэхніка, якая займаецца фізічным светам і можа непасрэдна ўзаемадзейнічаць з людзьмі. З дапамогай робататэхнікі мы можам палепшыць нашу працу рознымі спосабамі. У тым ліку экзаскелет ад Ford ці дапаможныя робаты з Boston Dynamics.
  2. Кагнітыўныя сістэмы, якія маюць справу з светам чалавека. Чатботы - добры прыклад кагнітыўнай сістэмы як часткі ІІ. Чатботы - вельмі наглядны прыклад таго, як людзі і машыны працуюць разам для дасягнення мэты. Chatbot - гэта інтэрфейс для зносін, які дазваляе людзям і арганізацыям весці размовы.
  3. Машыннае навучанне, якое займаецца інфармацыйным светам. Машыны выкарыстоўваюць дадзеныя для навучання, а машыннае навучанне імкнецца атрымаць сэнс з гэтых дадзеных. Машыннае навучанне выкарыстоўвае статыстычныя метады, каб машыны маглі палепшыць працу з машынамі. Падмноствам машыннага навучання з'яўляецца глыбокае навучанне, якое дазваляе шматслаёвым нейронным сеткам.

Штучны інтэлект складаецца з бяспройгрышнай інтэграцыі робататэхнікі, кагнітыўных сістэм і машыннага навучання.

Малюнак 1: Штучны інтэлект - адаптавана з Goel & Davies, 2019

7 крокаў да машыннага навучання

Давайце больш глыбока паглыбімся ў адзін з гэтых напрамкаў: машыннае навучанне. Мэта машыннага навучання - атрыманне сэнсу з дадзеных. Такім чынам, дадзеныя з'яўляюцца ключом да разблакіроўкі машыннага навучання. Існуе сем этапаў да машыннага навучання, і кожны крок распавядае пра дадзеныя:

Малюнак 2: 7 крокаў да машыннага навучання

1. Збор дадзеных

Шмат дадзеных аб навучанні патрабуецца для машыннага навучання (альбо з маркіроўкай, што азначае кіраванне навучаннем, альбо без маркіроўкі, што азначае непадкантрольнае навучанне). Збор або праверка дадзеных - гэта таксама першы крок у маёй новай мадэлі D2 + A2.

2. Падрыхтоўка дадзеных

Сырыя дадзеныя ў адзіночку не вельмі карысныя. Дадзеныя павінны быць падрыхтаваны, нармалізаваны, скапіяваны, а памылкі і скажэнні павінны быць ліквідаваны. Візуалізацыя дадзеных можа быць выкарыстана для пошуку заканамернасцей і выкраданняў, каб вызначыць, ці былі сабраны правільныя дадзеныя альбо адсутнічаюць дадзеныя.

3. Абярыце мадэль

Трэцім крокам з'яўляецца выбар правільнай мадэлі. Існуе мноства мадэляў, якія можна выкарыстоўваць для самых розных мэтаў. Выбіраючы мадэль, вам неабходна пераканацца, што мадэль адпавядае дзелавой мэты. Вы таксама павінны ведаць, колькі падрыхтоўкі патрабуе мадэль, наколькі яна дакладная і наколькі маштабуецца мадэль. Больш складаная мадэль не заўсёды лепшая мадэль. Найбольш часта выкарыстоўваюцца алгарытмы машыннага навучання ўключаюць лінейную рэгрэсію, лагістычную рэгрэсію, дрэвы рашэнняў, сярэднія K, аналіз асноўных кампанентаў (PCA), вектарныя машыны падтрымкі (SVM), наіўныя баі, выпадковыя лясныя і нейронныя сеткі.

4. Навучанне

Навучанне вашай мадэлі складае асноўную частку машыннага навучання. Мэта складаецца ў тым, каб выкарыстоўваць свае дадзеныя навучання і паступова ўдасканальваць прагнозы мадэлі. Кожны цыкл абнаўлення вагі і папярэдняй загрузкі - гэта навучальны крок. Кіраванае машыннае навучанне будуе мадэль з выкарыстаннем пазначаных узораў дадзеных, у той час як аўтаматычнае навучанне без нагляду робіць высновы з не пазначаных дадзеных (без спасылкі на вядомыя або пазначаныя вынікі).

5. Ацэнка

Пасля навучання мадэль ацэньвае мадэль. Гэта патрабуе тэставання машыннага навучання на нявыкарыстаныя запісы кіравання, каб праверыць яго працаздольнасць. Гэта можа быць прадстаўніком таго, як працуе мадэль у рэальным свеце, але гэта не павінна быць так. Чым большая колькасць зменных у рэальным свеце, тым большымі павінны быць дадзеныя аб навучанні і тэставанні.

6. Настройка параметраў

Пасля ацэнкі вашай мадэлі, вы павінны праверыць першапачаткова зададзеныя параметры для паляпшэння ІІ. Павелічэнне колькасці трэніровачных цыклаў можа прывесці да больш дакладных вынікаў. Аднак вы павінны вызначыць, калі мадэль дастаткова добрая, інакш вы будзеце дадаткова аптымізаваць мадэль. Гэта эксперыментальны працэс.

7. Прагназаванне

Пасля завяршэння збору дадзеных, падрыхтоўкі дадзеных, выбару мадэлі, падрыхтоўкі і ацэнкі мадэлі, а таксама аптымізацыі параметраў прыйшоў час адказаць на пытанні, выкарыстоўваючы прагнозы. Гэта могуць быць усе тыпы прагназавання: ад распазнавання малюнкаў да семантыкі да прагнастычнай аналітыкі.

Фінальныя думкі

Машыннае навучанне дазваляе праграмнаму забеспячэнню больш дакладна прагназаваць вынікі. Гэта палепшыць многія, калі не ўсе бізнес-працэсы ў бліжэйшыя гады. Такім чынам машыннае навучанне становіцца неад'емнай часткай аўтаматызаванай арганізацыі заўтрашняга дня. Дзякуючы ўсё больш хуткаму абсталяванню можна ўбачыць больш магутныя мадэлі з лепшымі прагнозамі.

На жаль, дзякуючы неаб'ектыўным дадзеных і навукоўцам дадзеных, праблема неаб'ектыўных мадэляў ніколі яшчэ далёкая. Для таго, каб прадпрыемствы сапраўды атрымлівалі карысць ад AI, яны павінны гарантаваць, што іх мадэлі і дадзеныя не прадузятыя, добра падрыхтаваны і ацэнены і няправільна ўзгоднены. Толькі тады кампаніі могуць атрымаць выгаду з машыннага навучання.

Калі мне ўдалося звярнуць вашу ўвагу на гэты момант, пакіньце каментар, які апісвае, як гэтая гісторыя паўплывала на вас, альбо падпішыцеся на мой штотыднёвы рассылку, каб атрымаць больш гэтага зместу:

Доктар Марк ван Рэйенам заснавальнік Datafloq і сусветна прызнаны дынамік для вялікіх дадзеных, blockchain і AI. Ён з'яўляецца стратэгам і аўтарам трох кніг пра кіраванне: Think Bigger, Blockchain і The Organization of Tomorrow. Бясплатны прагляд маёй апошняй кнігі можна знайсці тут. Звяжыцеся са мной на LinkedIn альбо павітайцеся ў Twitter і згадайце гэтую гісторыю.

Калі вы хочаце пагаварыць са мной пра кансультацыйныя працы ці лекцыі, вы можаце звязацца са мной па адрасе https://vanrijmenam.nl