Tatlong Bagong Paggamit ng Multilingual Module Ay Darating Sa TensorFlow

Tech / Tatlong Bagong Paggamit ng Multilingual Module Ay Darating Sa TensorFlow 2 minuto basahin

Paghahanap sa Google Voice



Ang Google ay isa sa mga tagasimuno ng pagsasaliksik ng AI at ang dami ng kanilang mga proyekto ay nagpunta sa ulo. AlphaZero mula sa Google DeepMind Ang koponan ay isang tagumpay sa pagsasaliksik ng AI, dahil sa kakayahan ng programa na alamin ang mga kumplikadong laro nang mag-isa (Nang walang Pagsasanay at Pamamagitan ng Tao). Nagawa rin ng mahusay ang Google sa Mga Programa sa Pagpoproseso ng Likas na Wika (NLPs), na isa sa mga dahilan sa likod ng kahusayan ng Google Assistant sa pag-unawa at pagproseso ng pagsasalita ng tao.

Kamakailan ay inihayag ng Google ang paglabas ng tatlong bago Gumamit ng mga modyul na maraming wika at magbigay ng higit pang mga multilingual na mga modelo para sa pagkuha ng magkatulad na semantikal na teksto.



Ang unang dalawang modyul ay nagbibigay ng mga modelo ng maraming wika para sa pagkuha ng katulad na semantikal na teksto, na-optimize para sa pagganap ng pagkuha at ang iba pa para sa bilis at mas kaunting paggamit ng memorya. Ang pangatlong modelo ay dalubhasa para sa pagkuha ng tanong-sagot sa labing-anim na wika (USE-QA) at kumakatawan sa isang ganap na bagong aplikasyon ng USE. Ang lahat ng tatlong mga modyul na maraming wika ay sinanay gamit ang a multi-task na framework ng dual-encoder , katulad ng orihinal na modelo ng USE para sa English, habang gumagamit ng mga diskarteng binuo namin para sa pagpapabuti ng dual-encoder na may additive margin na softmax na diskarte . Dinisenyo ang mga ito hindi lamang upang mapanatili ang mahusay na pagganap ng pag-aaral ng paglipat, ngunit upang maisagawa nang maayos ang mga gawain sa pagkuha ng semantiko.



Malayo na ang narating ng pagpoproseso ng wika sa mga system, mula sa pangunahing pag-parse ng puno ng syntax hanggang sa mga malalaking modelo ng pag-uugnay ng vector. Ang pag-unawa sa konteksto sa teksto ay isa sa pinakamalaking mga problema sa patlang ng NLP at malulutas ito ng Universal Sentence Encoder sa pamamagitan ng pag-convert ng teksto sa mga mataas na dimensional na vector, na ginagawang mas madali ang pagraranggo ng teksto at denotasyon.



Pinagmulan ng istraktura ng pagmamarka ng UTE - Google Blog

Ayon sa Google, ' Ang tatlong bagong mga module ay binuo sa semantic retrieval na arkitektura, na karaniwang hinati ang pag-encode ng mga katanungan at sagot sa magkakahiwalay na mga neural network, na ginagawang posible upang maghanap sa bilyun-bilyong mga potensyal na sagot sa loob ng milliseconds. 'Sa madaling salita, makakatulong ito sa mas mahusay na pag-index ng data.

' Ang lahat ng tatlong mga modyul na maraming wika ay sinanay gamit ang a multi-task na framework ng dual-encoder , katulad ng orihinal na modelo ng USE para sa English, habang gumagamit ng mga diskarteng binuo namin para sa pagpapabuti ng dual-encoder na may additive margin na softmax na diskarte . Dinisenyo ang mga ito hindi lamang upang mapanatili ang mahusay na pagganap ng pag-aaral ng paglipat, ngunit upang maisagawa nang maayos ang mga gawain sa pagkuha ng semantiko . ' Ang pag-andar ng Softmax ay madalas na ginagamit upang makatipid ng computational power sa pamamagitan ng pagpapalawak ng mga vector at pagkatapos ay paghati-hatiin ang bawat elemento sa kabuuan ng exponential.



Arkitekturang pagkuha ng semantiko

'Ang tatlong bagong modyul ay pawang itinayo sa mga arkitektura ng semantiko na pagkuha, na karaniwang hinati ang pag-encode ng mga katanungan at sagot sa magkakahiwalay na mga neural network, na ginagawang posible upang maghanap sa bilyun-bilyong mga potensyal na sagot sa loob ng milliseconds. Ang susi sa paggamit ng dalawahang mga encoder para sa mahusay na pagkuha ng semantiko ay upang paunang i-encode ang lahat ng mga sagot ng kandidato sa inaasahang mga query sa pag-input at iimbak ang mga ito sa isang vector database na na-optimize para sa paglutas ng pinakamalapit na problema ng kapitbahay , na nagpapahintulot sa isang malaking bilang ng mga kandidato na mabilis na mahahanap nang mabuti katumpakan at pagpapabalik . '

Maaari mong i-download ang mga modyul na ito mula sa TensorFlow Hub. Para sa karagdagang pagbabasa sumangguni sa buong GoogleAI blogpost .

Mga tag google