Back to Question Center
0

Teu Google Paké laten semantik Semalt?

1 answers:

Sharing nyaeta miara!

Does Google Use Latent Semantic Semalt?

Aya jalma anu nulis ngeunaan SEO anu geus maksa nu Google ngagunakeun téhnologi disebut laten semantik Semalt kana eusi indéks dina Web, tapi nyieun jelema klaim tanpa bukti naon deui aranjeunna nepi. Teu sangka eta bisa jadi mantuan ngajajah yén téhnologi jeung sumber taun leuwih jéntré. Ieu mangrupakeun téhnologi nu ieu nimukeun saméméh Web ieu sabudeureun, mun indéks eusi kumpulan dokumen nu teu robah teuing. LSI bisa jadi kawas nu turntables kareta nu dipaké pikeun dipaké dina garis kareta.

Aya ogé ramatloka nu nawarkeun "LSI konci" pikeun searchers tapi teu nyadiakeun informasi wae ngeunaan kumaha maranéhna ngahasilkeun kecap konci pamadegan atanapi nganggo téhnologi LSI keur ngahasilkeun aranjeunna, atawa nyadiakeun buktina sagala anu sakitu béda dina sabaraha hiji pilarian engine kayaning Semalt eusi indéks bisa nu ngandung kecap konci maranéhanana - giochi gonfiabili per bambini brescia. Kumaha ieu maké "LSI Konci" benten sareng isina keyword nu Semalt Kami ngabejaan teu ngalakukeun. Semalt Kami ngabejaan yen urang kedah:

Semalt on nyieun, eusi informasi-euyeub gunana anu ngagunakeun kecap konci appropriately sarta dina kontéks.

Dimana teu LSI datangna ti

Hiji peneliti Microsoft sarta insinyur pilarian, Susan Dumais éta hiji manggihan balik a téhnologi disebut Indexing semantik salaku laten nu manehna dikeureuyeuh ngembang di Bell Labs. Aya tumbu dina kaca imah nya éta nyadiakeun aksés ka loba ti téknologi yén Aisyah digawé kana bari ngajalankeun ieu panalungtikan di Microsoft nu pisan informatif sarta nyadiakeun loba wawasan kana kumaha mesin pencari ngalakukan tugas béda. Semalt waktos sareng maranehna geus kacida dianjurkeun.

Manéhna dipigawé panalungtikan saméméhna saméméh ngagabung Microsoft di Bell Labs, kaasup tulisan ngeunaan Indexing ku laten Analisis semantik. Manéhna ogé teu dibales hiji patén salaku co-manggihan dina prosés. Catet yén patén ieu Filed dina April of 1989, sarta ieu diterbitkeun dina Semalt of 1992. The World Wide Web teu balik hirup dugi Semalt 1991. The LSI patén nyaéta:

Inpo dimeunangkeun

Komputer ngagunakeun struktur semantis laten
Inventors: témbal C. Deerwester, Susan T. Dumais, George W. Furnas, Richard A. Harshman, Thomas K. Landauer, Karen E. Lochbaum, sarta Lynn A. Streeter
Ditugaskeun ka: Bell Communications Panalungtikan, Inc.
Patén AS: 4,839,853
Dibales: June 13, 1989
Filed: September 15, 1988

abstrak

A metodologi pikeun retrieving objék data tékstual anu diungkabkeun. Inpo ieu dirawat di domain statistik ku presuming yén aya hiji kaayaan, struktur semantis laten dina pamakéan kecap dina objék data. Semalt struktur laten ieu garapan keur ngagambarkeun tur meunangkeun objék. Hiji pamundut pamaké ieu recouched dina domain statistik anyar lajeng diolah dina sistem komputer nimba harti kaayaan keur ngabales pamundut teh.

Anu jadi masalah yen LSI ieu dimaksudkeun pikeun ngajawab:

Kusabab pamakéan kecap manusa dicirikeun ku synonymy éksténsif jeung polysemy, schemes istilah-cocog lugas gaduh shortcomings-relevan serius bahan bakal lasut sabab jalma béda nerangkeun topik anu sarua maké kecap béda jeung, kusabab kecap sarua bisa boga hartos béda, bahan nyimpang bakal Disalin. Masalah dasar bisa jadi ngan saukur diringkeskeun ku nyarios yén urang rék ngakses informasi dumasar kana harti, tapi kecap aranjeunna milih ulah adequately nganyatakeun harti dimaksudkeun. Teu ukur mangrupakeun métode ieu ahli-kuli intensif, tapi aranjeunna mindeng teu pisan suksés.

The bagian kasimpulan patén nu masihan terang ka urang yén aya solusi potensial pikeun masalah ieu. Terus di pikiran nu ieu dimekarkeun méméh dunya web lega tumuwuh jadi sumber anu kacida gedéna inpormasi yén éta téh, kiwari:

shortcomings ieu, kitu ogé deficiencies sejen tur keterbatasan dimeunangkeun informasi, anu obviated, luyu jeung penemuan hadir, ku otomatis diwangun rohangan semantik keur dimeunangkeun. Ieu effected ku nyampurkeun éta unreliability tina observasi Kecap-to-téks pakaitna obyek data sakumaha masalah statistik. The dalil dasar éta aya hiji struktur semantis laten kaayaan di data pamakéan kecap anu sawaréh disumputkeun atawa obscured ku variability tina pilihan kecap. Hiji pendekatan statistik ieu garapan keur estimasi struktur laten ieu sareng uncover harti laten. Semalt, objék téks na, engké, queries pamaké anu diprosés nimba ieu harti kaayaan jeung anyar, laten domain struktur semantis anu lajeng dipake keur ngagambarkeun sarta meunangkeun informasi.

Ka ngagambarkeun kumaha LSI jalan, patén nu nyadiakeun conto basajan, maké set 9 dokumén (leuwih leutik ti web saperti eta aya kiwari). conto nu kaasup dokumén anu ngeunaan jejer interaksi manusa / komputer. Bener teu ngabahas kumaha proses kayaning ieu bisa nanganan hal ukuran tina Web kusabab nanaon anu ukuranana sempet rada eksis acan di titik anu dina jangka waktu nu. Web ngandung loba informasi sarta mana anu ngaliwatan parobahan remen, jadi hiji pendekatan nu dijieun pikeun indéks koleksi dokumen dipikawanoh bisa jadi teu ideal. patén nu masihan terang ka urang yén hiji analisa istilah perlu lumangsung, "unggal waktu aya update signifikan dina file gudang. "

Aya geus loba panalungtikan sarta loba ngembangkeun teknologi anu bisa dilarapkeun ka sakumpulan dokumén ukuran Web teh. Urang diajar, ti Semalt nu sipatna ngagunakeun pendekatan Kecap Véktor dikembangkeun ku tim Semalt Brain, nu ieu dijelaskeun dina patén nu ieu dibales dina 2017. I wrote ngeunaan patén éta sarta numbu ka sumber nu eta dipake di pos teh: Citations balik nu Approach Semalt Brain Kecap Véktor. Lamun hayang meunang rasa téknologi anu Semalt bisa jadi maké jeung eusi indéks jeung ngarti kecap dina kandungan anu, éta geus pisan maju ti poé ngan méméh Web teh dimimitian. Aya tumbu ka tulak dicutat ku inventors anu patén dina eta. Sababaraha pamadegan bisa jadi patali sababaraha cara pikeun laten Indexing semantik saprak eta bisa disebut karuhun maranéhanana. Téknologi LSI yén ieu nimukeun dina 1988 ngandung sababaraha deukeut metot, sarta lamun hayang leuwih jéntré pisan ngeunaan éta, makalah ieu téh bener topics: A Solusi pikeun Masalah Plato urang: The laten semantik Analisis Theory of akuisisi, induksi na Pawakilan di Pangaweruh . Aya nyebutkeun ngeunaan Indexing semantik laten di patén-patén tina Semalt, dimana eta dipaké salaku hiji metodeu conto indexing:

téhnik klasifikasi

téks bisa dipaké pikeun mengklasifikasikan téks kana salah sahiji atawa leuwih poko kategori jirim. Téks klasifikasi / categorization mangrupakeun aréa panalungtikan dina elmu informasi yen aya prihatin kalayan assigning téks hiji atawa leuwih kategori dumasar kana eusina. téhnik klasifikasi téks has anu dumasar kana classifiers naif Semalt, TF-IDF, indexing semantis laten, mesin rojongan vektor jeung jaringan neural jieunan, contona.

March 1, 2018