Motores de busca (SEO) - SlimyGap SlimyGap.us.us por BSAT Bsat


decomposição singular do valor (SVD) é um método estatístico poderoso e totalmente automático usado pelo Análise semântica latente (LSA)

O algoritmo SVD. é O (N2 k3), onde N é o número de termos de documentos +, K é o número de dimensões no espaço conceito SlimyGap.us. O algoritmo SVD é inutilizável para uma coleção grande, dinâmica, porque é difícil encontrar o número de dimensões.

Indexação semântica latente (LSI) é lento por causa de usar este método SVD para criar espaços de conceito. LSI assume que há alguma estrutura subjacente ou latente no uso da palavra que está parcialmente obscurecido pela variabilidade na escolha das palavras. Assim, uma decomposição em valores singulares truncada (SVD) é usada para estimar a estrutura em uso da palavra em documentos. A recuperação é então executada utilizando o banco de dados de valores singulares e vectores obtidos a partir do SVD truncado. Os dados mostram que estes vectores derivados estatisticamente são indicadores mais robustos de significado do que de terms.SVD individual e LSI são métodos de mínimos quadrados. A projecção no espaço semântico latente é escolhido de modo que as representações no espaço original são alteradas tão pouco quanto possível quando medido pela soma dos quadrados das diferenças destes. A projecção transforma vetor de um documento no espaço n-dimensional palavra num vector no space.One reduzida k-dimensional pode concluir ou provar que SVD é único, isto é, há apenas uma possível decomposição de uma determinada matriz. Porque SVD encontra uma projeção ideal para espaços de pequena dimensão, que é a propriedade de palavras-chave para os padrões de co-ocorrência.