Atualmente Vazio: R$0.00
Sobre a Aula
O aspecto mais importante do Machine Learning é quais dados são usados para treiná-lo. Descubra como os dados de treinamento afetam as previsões de uma máquina e por que dados tendenciosos podem levar a decisões tendenciosas.
Comece a aprender em http://code.org/
Criado por Code.org.
A qualidade do aprendizado de máquina depende dos dados que você coloca. Quanto mais dados de alta qualidade, melhor será o aprendizado. Mas se os dados são tão importantes, surge uma pergunta: de onde eles vêm?
Muitas vezes, os computadores coletam dados automaticamente de pessoas como nós, sem esforço algum. Por exemplo, um serviço de streaming pode acompanhar o que você assiste e reconhecer padrões para recomendar conteúdos que você pode gostar.
Outras vezes, os dados são coletados diretamente com a nossa ajuda. Quando um site pede para identificar placas de trânsito ou faixas de pedestres, na verdade, estamos fornecendo dados para ajudar máquinas a “enxergar” melhor e, talvez, até aprender a dirigir sozinhas.
Na medicina, pesquisadores usam imagens médicas para ensinar computadores a reconhecer e diagnosticar doenças. Mas isso exige milhares de imagens e o conhecimento de especialistas para que a máquina aprenda a fazer diagnósticos precisos.
Mesmo com muitos exemplos, podem surgir problemas. Imagine que um computador foi treinado apenas com radiografias de homens. Se um raio-X de uma mulher for analisado, a IA pode falhar no diagnóstico. Isso acontece porque os dados estavam distorcidos (“bias”) — favorecendo um grupo e excluindo outro.
Essa distorção pode surgir em qualquer sistema de IA. Se os dados coletados não representam a diversidade do mundo real, as previsões do computador podem ser imprecisas ou até injustas. E, muitas vezes, os próprios cientistas não percebem essa falha.
Por isso, ao analisar dados de aprendizado, devemos nos perguntar: Os dados são suficientes para treinar a IA com precisão? Eles representam todos os cenários e usuários de forma justa?
É aqui que o fator humano se torna essencial. Cabe a nós garantir que os dados sejam diversos e imparciais, coletando informações de fontes variadas.
Lembre-se: na Aprendizagem de Máquina, os dados são o código. Quanto melhores forem os dados, melhor será a IA.
Fonte Original: Khan Academy - IA para Educação
Licença: Creative Commons Atribuição-Não Comercial-Compartilha Igual 3.0 (CC BY-NC-SA 3.0 US).

