@MASTERSTHESIS{ 2016:1172326522, title = {Estudo comparativo de diferentes classificadores baseados em aprendizagem de máquina para o processo de Reconhecimento de Entidades Nomeadas}, year = {2016}, url = "http://localhost:8080/tede/handle/tede/554", abstract = "O processo de Reconhecimento de Entidades Nomeadas (REN) é a tarefa de iden- tificar termos relevantes em textos e atribuí-los um rótulo. Tais palavras podem referenciar nomes de pessoas, organizações e locais. A variedade de técnicas que podem ser usadas no processo de reconhecimento de entidades nomeadas é grande. As técnicas podem ser classificadas em três abordagens distintas: baseadas em regras, baseadas em aprendizagem de máquina e híbridas. No que diz respeito as abordagens de aprendizagem de máquina, diversos fatores podem influenciar sua exatidaõ, incluindo o classificador selecionado, o conjunto de features extraídas dos termos, as características das bases textuais e o número de rótulos de entidades. Neste trabalho, comparamos classificadores que utilizam aprendizagem de máquina aplicadas a tarefa do REN. O estudo comparativo inclui classificadores baseados no CRF (Condicional Random Fields), MEMM (Maximum Entropy Markov Model) e HMM (Hidden Markov Model), os quais são comparados em dois corporas em português derivados do WikiNer, e HAREM, e dois corporas em inglês derivados doCoNLL-03 e WikiNer. A comparação dos classificadores demonstra que o CRF é superior aos demais classificadores, tanto com textos em português, quanto inglês. Este estudo também inclui a comparação da contribuição, individual e em conjunto de features, incluindo features de contexto, além da comparação do REN por r´otulos de entidades nomeadas, entre os classificadores e os corpora.", publisher = {Universidade Estadual de Feira de Santana}, scholl = {Mestrado em Computação Aplicada}, note = {DEPARTAMENTO DE TECNOLOGIA} }