{"id":73653,"date":"2015-08-06T14:18:36","date_gmt":"2015-08-06T17:18:36","guid":{"rendered":"http:\/\/www.redenoticia.com.br\/noticia\/?p=73653"},"modified":"2015-08-06T14:18:36","modified_gmt":"2015-08-06T17:18:36","slug":"algoritmos-facilitam-classificacao-automatizada-de-textos-da-internet","status":"publish","type":"post","link":"https:\/\/www.redenoticia.com.br\/noticia\/2015\/algoritmos-facilitam-classificacao-automatizada-de-textos-da-internet\/73653","title":{"rendered":"Algoritmos facilitam classifica\u00e7\u00e3o automatizada de textos da internet"},"content":{"rendered":"<p> Diego Freire | Ag\u00eancia FAPESP (<strong><em>classifica\u00e7\u00e3o de textos da internet<\/em><\/strong>) &#8211; Um conjunto de algoritmos desenvolvidos no Instituto de Ci\u00eancias Matem\u00e1ticas e de Computa\u00e7\u00e3o (ICMC) da Universidade de S\u00e3o Paulo (USP), em S\u00e3o Carlos, permite filtrar, entre grandes quantidades de textos, dados que possibilitam classific\u00e1-los de acordo com o teor de seu conte\u00fado.<\/p>\n<p>Dessa forma, coment\u00e1rios publicados em redes sociais podem ser facilmente identificados como positivos ou negativos e cole\u00e7\u00f5es de bibliotecas virtuais podem ser categorizadas de acordo com o g\u00eanero liter\u00e1rio, temas e outros aspectos espec\u00edficos de cada obra.<\/p>\n<p>Os algoritmos foram desenvolvidos por Rafael Geraldeli Rossi, respons\u00e1vel pela pesquisa de doutorado , realizada com o apoio da FAPESP. O trabalho foi premiado na 16th International Conference on Intelligent Text Processing and Computational Linguistics, em abril, no Egito.<\/p>\n<p>\u201cA quantidade de informa\u00e7\u00f5es \u00e0 disposi\u00e7\u00e3o em diferentes plataformas facilmente acess\u00edveis, como a web, \u00e9 cada vez maior. \u00c9 preciso que sejam desenvolvidas novas estrat\u00e9gias para filtr\u00e1-las de maneira inteligente, sem que dados se percam no processo e garantindo maior precis\u00e3o na interpreta\u00e7\u00e3o das informa\u00e7\u00f5es\u201d, disse Rossi.<\/p>\n<p>Os algoritmos desenvolvidos por Rossi permitem a classifica\u00e7\u00e3o, considerando n\u00e3o s\u00f3 a incid\u00eancia de termos espec\u00edficos em diferentes textos, mas tamb\u00e9m redes formadas por associa\u00e7\u00f5es entre termos, o que agiliza o processo e diminui a quantidade de informa\u00e7\u00f5es que precisam ser fornecidas para \u201ctreinar\u201d a m\u00e1quina.<\/p>\n<p>O trabalho \u00e9 desenvolvido por meio de aprendizado de m\u00e1quina, campo da intelig\u00eancia artificial dedicado ao desenvolvimento de algoritmos e de t\u00e9cnicas que permitem ao computador aperfei\u00e7oar seu desempenho em alguma tarefa, \u201caprendendo\u201d a partir de exemplos previamente classificados por um usu\u00e1rio ou especialista.<\/p>\n<p>De acordo com Solange Oliveira Rezende, pesquisadora do ICMC e orientadora da pesquisa, a representa\u00e7\u00e3o de dados em redes possibilita melhorar a organiza\u00e7\u00e3o e classifica\u00e7\u00e3o de dados considerando poucos exemplos anteriormente classificados.<\/p>\n<p>\u201cA representa\u00e7\u00e3o das rela\u00e7\u00f5es entre termos em redes permite aprender padr\u00f5es que n\u00e3o s\u00e3o assimilados em outros tipos de representa\u00e7\u00f5es. A partir da\u00ed foram desenvolvidos os algoritmos que manipulam essas representa\u00e7\u00f5es em redes de termos, permitindo fazer an\u00e1lises sobre os diferentes tipos de rela\u00e7\u00f5es que podem existir entre os termos e adequando o aprendizado de m\u00e1quina \u00e0s necessidades do usu\u00e1rio\u201d, explicou.<\/p>\n<p>Para Rezende, os algoritmos desenvolvidos por Rossi simplificam o processo de classifica\u00e7\u00e3o sem prejudicar sua precis\u00e3o e minimizando a complexidade computacional.<\/p>\n<p>\u201cO grande diferencial do trabalho \u00e9 que ele n\u00e3o considera apenas a frequ\u00eancia dos termos nos documentos, que \u00e9 o mais comum nesse tipo de pesquisa. Leva-se em conta tamb\u00e9m a rela\u00e7\u00e3o entre termos para realizar a classifica\u00e7\u00e3o dos textos.\u201d<\/p>\n<p>O trabalho foi desenvolvido no \u00e2mbito da pesquisa , conduzida por Rezende no ICMC tamb\u00e9m com o apoio da FAPESP.<\/p>\n<p>O objetivo, explicou a pesquisadora, \u00e9 investigar m\u00e9todos de aprendizado de m\u00e1quina para apoiar a constru\u00e7\u00e3o autom\u00e1tica de sensores da Web.<\/p>\n<p>\u201cO desenvolvimento de um websensor depende de especialistas para defini\u00e7\u00e3o dos par\u00e2metros do sensor, como express\u00f5es para busca, filtros e monitoramentos de conte\u00fado textual da Web, o que torna o processo mais complexo. Os algoritmos de aprendizado de m\u00e1quina semissupervisionados para classifica\u00e7\u00e3o de textos, como os desenvolvidos na pesquisa, podem ser utilizados para gerar sensores e monitorar exemplos de interesse do usu\u00e1rio\u201d, disse Rezende.<\/p>\n<p>Segundo a pesquisadora, o estudo busca contribuir ainda com a explora\u00e7\u00e3o do potencial da Web como \u201cum grande e poderoso sensor social, permitindo monitorar v\u00e1rios tipos de eventos a partir de textos publicados em portais de not\u00edcias e redes sociais, como detec\u00e7\u00e3o de epidemias, extra\u00e7\u00e3o de indicadores pol\u00edticos e econ\u00f4micos e an\u00e1lise de sentimentos\u201d.<\/p>\n<p>Os resultados da pesquisa de Rossi, que conta ainda com a colabora\u00e7\u00e3o de Alneu de Andrade Lopes, professor do ICMC, podem ser acessados em .<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Diego Freire | Ag\u00eancia FAPESP (classifica\u00e7\u00e3o de textos da internet) &#8211; Um conjunto de algoritmos desenvolvidos no Instituto de Ci\u00eancias Matem\u00e1ticas e de Computa\u00e7\u00e3o (ICMC) da Universidade de S\u00e3o Paulo (USP), em S\u00e3o Carlos, permite filtrar, entre grandes quantidades de textos, dados que possibilitam classific\u00e1-los de acordo com o teor de seu conte\u00fado. Dessa forma, [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":57576,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_genesis_hide_title":false,"_genesis_hide_breadcrumbs":false,"_genesis_hide_singular_image":false,"_genesis_hide_footer_widgets":false,"_genesis_custom_body_class":"","_genesis_custom_post_class":"","_genesis_layout":"","_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[22],"tags":[],"class_list":{"0":"post-73653","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-brasil","8":"entry","9":"gs-1","10":"gs-odd","11":"gs-even","12":"gs-featured-content-entry"},"jetpack_featured_media_url":"https:\/\/www.redenoticia.com.br\/noticia\/imagens\/tecnologia1.jpg","jetpack_sharing_enabled":true,"jetpack_likes_enabled":true,"_links":{"self":[{"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/posts\/73653","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/comments?post=73653"}],"version-history":[{"count":0,"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/posts\/73653\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/media\/57576"}],"wp:attachment":[{"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/media?parent=73653"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/categories?post=73653"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.redenoticia.com.br\/noticia\/wp-json\/wp\/v2\/tags?post=73653"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}