Фота Mpho Mojapelo на Unsplash

API інтэрфейсу: што гэта такое і як імі карыстацца

Набор лепшых практык для API штучнага інтэлекту

Вам цікавыя API-размовы на тэкст, пераклад мовы альбо распазнаванне малюнкаў? Вам пашанцавала! Ёсць мноства сэрвісаў, якія дазваляюць гэта зрабіць, а таксама мноства прычын выкарыстоўваць API штучнага інтэлекту (AI) у сваіх дадатках. У гэтым артыкуле мы раскажам пра некаторыя выпадкі выкарыстання API інтэрфейсаў AI, а потым пагаворым пра лепшыя практыкі, якія трэба выкарыстоўваць пры іх выкарыстанні.

Калі вы спяшаецеся, спяшаецеся да TL; DR ўнізе.

Першае пытанне перад тым, як унесці знешнюю службу, трэба задаць сабе пытанне "ці трэба мне гэта?" Калі справа даходзіць да API штучнага інтэлекту, адказ можа ўскладніцца! Каб дапамагчы вам прыняць рашэнне, давайце разгледзім дзве найбольш часта выкарыстоўваюцца паслугі, і калі вы павінны (ці не павінны) імі карыстацца.

Выкарыстоўвайце выпадак № 1: Гаворка ў тэкст

Шмат якія прыкладання сёння выкарыстоўваюць магчымасці гаворкі ў тэкст - і вы, напэўна, ужо выкарыстоўвалі тое, што ёсць. Сіры, Google Assistant, Bixby або Alexa выкарыстоўваюць яго, але гэта яшчэ не ўсё. Яго таксама выкарыстоўваюць прыкладанні для абмену паведамленнямі (напрыклад, WhatsApp) і пошукавыя сістэмы (напрыклад, панэль пошуку Google).

Вы можаце задацца пытаннем, дзе знаходзіцца ШІ там. Гэта не проста транскрыпцыя прамовы?

Асновай любога API для прамовы ў тэкст з'яўляецца прыняцце маўленчага аўдыё ў якасці ўваходу і перапісванне яго ў тэкст, хаця і тут ён не спыніцца, і тады адбываецца магія штучнага інтэлекту. Для большасці API, даступных там, ён таксама:

  • змяніць папярэднюю транскрыпцыю ў залежнасці ад кантэксту
  • ідэнтыфікаваць розных выступоўцаў
  • быць у стане шукаць пэўныя ключавыя словы
  • дазволіць мадэляваць мадэль (карысна для рэгіянальных акцэнтаў)

Выкарыстоўвайце гэта: для канкрэтных выпадкаў выкарыстання, напрыклад, падчас сінтэзу маўлення падчас судовага разбору, дзе кантэкст, словы, якія выкарыстоўваюцца, і бягучы выступоўца вельмі важныя.

Не выкарыстоўвайце гэта: калі вы чакаеце толькі аднаго дынаміка альбо для простага абмену тэкставымі паведамленнямі. У гэтым выпадку большасць клавіятур смартфона ўжо ўключаюць магчымасці распазнання гаворкі, якія можна выкарыстоўваць, а для вэб-прыкладанняў можна выкарыстоўваць API SpeechSynthesis.

Выкарыстоўвайце выпадак № 2: Распазнаванне малюнкаў

У параўнанні з прамовай да тэксту, у цяперашні час ёсць некалькі прыкладанняў, якія выкарыстоўваюць распазнаванне малюнкаў, і большасць з іх даволі спецыфічныя (напрыклад, PlantNet, які ідэнтыфікуе расліны, якія вы фатаграфуеце). Хоць мы пачынаем бачыць агульнае выкарыстанне гэтага, у прыватнасці, з:

  • Google аб'ектыў: аналізуе тое, што знаходзіцца на экране (малюнак ці не), і паспрабуе вызначыць адрасы, месцы, рэчы і рэкамендаваць вынікі на яго аснове
  • Бачачы AI: прыкладанне для людзей са слабым зрокам, якое апісвае тое, што вакол іх (у залежнасці ад таго, куды паказвае камеру тэлефона)
Выкарыстоўваючы аб'ектыў Google для распазнання месца

Як вы ўжо зразумелі, магія складаецца ў тым, каб зрабіць здымак у якасці ўваходных дадзеных і паспрабаваць вызначыць, што ёсць на згаданай карціне. Для большасці пастаўшчыкоў ёсць два спосабы:

  • Выкарыстанне загадзя падрыхтаваных мадэляў: сюды ўваходзяць агульныя заняткі (ежа, месцы, людзі, колер ...)
  • Выкарыстанне ўласных класіфікатараў: яны дазваляюць карыстальнікам навучаць свае ўласныя класы (як гэта відаць з PlantNet вышэй)

Хоць некаторыя прылады Android і iOS маюць убудаваныя магчымасці распазнавання малюнкаў, як распрацоўшчык вы не заўсёды можаце запытаць іх у сваім дадатку. Такім чынам, пакуль ваш выпадак выкарыстання падыходзіць, вы павінны выкарыстоўваць яго.

Выкарыстоўвайце выпадак № 3, № 4 ...

Ёсць шмат іншых AI API там. Мы не збіраемся разглядаць іх у гэтым пасце, але калі вы думаеце выкарыстоўваць адзін з іх і не ўпэўненыя, ці адпавядае вашаму выпадку выкарыстання, пакіньце каментар альбо звяжыцеся са мной непасрэдна. Я буду рады дапамагчы!

Цяпер вы вырашылі выкарыстоўваць адзін, два ці нават больш (у гэтым выпадку вось артыкул для вас) AI API ў вашым дадатку. У гэтым раздзеле мы ўбачым некалькі лепшых практык, якія трэба скарыстаць, перш чым думаць аб іх выкарыстанні ў вытворчасці.

Паспрабуйце, перш чым купіць

Як і ў кожнага трэцяга боку API, тут трэба ўлічваць параметры - кошт, зручнасць выкарыстання, даступнасць ... але калі гаворка ідзе пра штучны інтэлект, ёсць і фактар ​​надзейнасці, які ўваходзіць у гульню. каэфіцыент 0 альбо 1. На самай справе гэта будзе што-небудзь паміж 0 і 1, як мы ўбачым у наступным раздзеле!

Усе асноўныя пастаўшчыкі хмарных тэхналогій прапануюць уласны набор AI API, і ўсе яны маюць альбо дэманстрацыйную старонку, альбо бясплатную пробную версію. Скарыстайцеся гэтым, паспрабуйце самі і выберыце той, які дасць найлепшыя вынікі!

  • IBM Watson
  • Google Cloud AI
  • Пазнавальныя паслугі Microsoft
  • Паслугі AWS AI

Тут таксама ёсць платформы для канкрэтных паслуг, такія як Clarifai (Vision API), SAP Conversational AI (Chatbots) альбо просты ўстаўкі - ваш любімы-пошукавік.

Прыклад выкліку паслугі Watson Assistant пры дапамозе паштальёна

Штучны інтэлект упэўнена рыфмуецца

Як гаварылася ў папярэднім раздзеле, кожны раз, калі вы атрымаеце адказ ад API AI, ён таксама будзе ўтрымліваць узровень даверу ў дыяпазоне ад 0 да 1, што адпавядае адсотку дакладнасці, які ён прызнаў.

Давайце возьмем прыклад з API візуальнага прызнання пры адпраўцы наступнага малюнка:

Крэдыты: Getty.com

Вось адказ JSON. Я выдаліў некаторыя класы для чытання.

[{"classifier_id": "па змаўчанні", "імя": "па змаўчанні", "класы": [{"клас": "шына", "лік": 0.797}, {"клас": "механічная прылада", " бал ": 0.506}, {" клас ":" Індыйскі чырвоны колер "," лік ": ​​0,799}]," дысплей ":" Агульная мадэль "," апісанне ":" Хутка зразумець прадметы, дзеянні, сцэны і колеры ў вобраз ". }]

У гэтым выпадку ў нас ёсць клас, які ідэнтыфікуецца разам з ацэнкай даверу. Улік гэтай ацэнкі з'яўляецца ключавым. Я звычайна рэкамендую мінімальны бал даверу 95%. Гэты вынік павінен павялічвацца з цягам часу, калі вы ці ваш пастаўшчык API дадасце да мадэляў больш дадзеных аб навучанні.

Кажучы аб дадзеных пра навучанне, яшчэ адна рэч, якую вы хочаце падумаць, - ці хочаце вы дазволіць, каб дадзеныя, дасланыя з вашай заяўкі, выкарыстоўваліся для паляпшэння агульных мадэляў правайдэра. Калі вы хочаце дазволіць гэта, вам трэба паведаміць пра гэта сваім карыстальнікам.

TL; DR:

  • Перад тым, як выкарыстоўваць AI API, вызначыцеся, ці сапраўды ён вам патрэбны
  • У гэтым выпадку паспрабуйце розных пастаўшчыкоў і абярыце той, які лепш за ўсё падыходзіць для вашага выпадку
  • Пераканайцеся, што парог досыць высокі па ацэнцы даверу, каб пазбегнуць ілжывых спрацоўванняў

Весяліцеся, уліваючы AI у свае прыкладанні!