Atualmente Vazio: R$0.00
Sobre a Aula
Computer Vision é uma forma de aprendizado de máquina usada em carros autônomos, sistemas de reconhecimento facial e agricultura sustentável. Descubra como um computador aprende a classificar imagens, como ele pode construir de formas simples a figuras mais complexas e por que é tão difícil para um computador diferenciar um chihuahua de um muffin.
Apresentando
Alejandro Carrillo (Farmwise), que constrói robôs agrícolas de última geração que usam visão computacional para cultivar plantações de forma mais eficiente.
Kate Park (Tesla), que trabalha nos carros autônomos do Tesla Autopilot.
Produzido e dirigido por Jael Burrows
Coproduzido por Kristin Neibert
Escrito por Hadi Partovi, Mike Harvey, Winter Dong, Erin Bond, Dan Schneider e Jael Burrows
Câmera por Bow Jones. Criado por Code.org.
Visão Computacional: Como as Máquinas Aprendem a Ver
Alejandro Carrillo: Olá! Meu nome é Alejandro Carrillo e sou engenheiro de robótica em uma empresa agrícola. Minha equipe usa aprendizado de máquina, robótica e visão computacional para identificar a diferença entre alimentos bons para consumo e aqueles que absorvem todos os nutrientes do solo. Com essa tecnologia, conseguimos remover os alimentos ruins sem utilizar produtos químicos.
Kate Park: Meu nome é Kate Park e eu trabalho na Tesla Autopilot, construindo carros autônomos. Acredito que sempre que houver uma oportunidade de tornar o uso de recursos mais eficiente, a tecnologia pode desempenhar um papel fundamental. Mas, para mim, uma das formas mais impactantes da IA é justamente através dos veículos autônomos.
Você já se perguntou como um computador reconhece um rosto ou dirige um carro? Ou por que é tão difícil para uma máquina diferenciar um cachorro de um pão? Tudo isso tem a ver com visão computacional, que é a forma como as máquinas interpretam imagens. Vamos explorar como isso funciona!
Como os Computadores Enxergam?
Vamos começar com um exemplo simples. Aqui estão duas formas: um X e um O.
Nós aprendemos facilmente a diferença entre essas formas, mas um computador, ao olhar para elas pela primeira vez, só vê um monte de pequenos quadrados chamados pixels. Cada pixel tem um valor numérico, e o computador precisa interpretar esses números para entender o que está na imagem.
Na programação tradicional, podemos ensinar o computador a reconhecer formas definindo regras explícitas:
-
Se os pixels do centro e dos cantos estiverem preenchidos, então é um X.
-
Se esses pixels estiverem vazios, então é um O.
Esse método funciona bem para imagens simples, mas e se as formas forem um pouco diferentes? O computador pode acabar classificando incorretamente os Xs como Os, porque eles não se encaixam exatamente na regra programada.
Treinando Máquinas para Enxergar
Com aprendizado de máquina, podemos ensinar um computador a reconhecer formas independentemente de tamanho, rotação ou simetria. Para isso, precisamos de milhares ou até milhões de exemplos e um processo de tentativa e erro.
No início, a máquina faz palpites aleatórios. Se errar, recebe a resposta correta e ajusta seu modelo, melhorando aos poucos sua precisão.
A cada tentativa, o computador observa padrões nos pixels, como bordas e ângulos. Por exemplo:
-
Se encontrar duas bordas formando 90 graus, pode ser um quadrado.
-
Se vir um arco com um círculo dentro, pode ser um olho.
Quanto mais dados e tentativas, mais refinado fica o modelo de reconhecimento.
Como as Redes Neurais Ajudam na Visão Computacional
Diferenciar um X de um O é fácil, mas imagens do mundo real são muito mais complexas. Para resolver isso, usamos redes neurais artificiais, que processam imagens em camadas:
-
Camada inicial: recebe os pixels como números e detecta bordas.
-
Camadas intermediárias: combinam essas bordas para identificar formas simples.
-
Camada final: junta todas as informações e reconhece a cena completa.
Esse processo pode exigir milhões de imagens rotuladas para que a máquina aprenda corretamente.
Mas nem sempre os resultados são perfeitos. Algumas redes neurais de reconhecimento facial, por exemplo, têm dificuldade em identificar pessoas negras porque foram treinadas principalmente com imagens de pessoas brancas.
E às vezes, os erros são engraçados, como quando um modelo de IA confunde um cachorro com um pão! Mas quando se trata de diagnosticar doenças médicas ou evitar acidentes em carros autônomos, é fundamental que esses sistemas sejam treinados corretamente.
A Importância de Dados de Qualidade
A visão computacional abre um mundo de possibilidades, desde melhorar a agricultura até ajudar médicos a detectar doenças. Mas, no final das contas, uma máquina só é tão boa quanto os dados usados para treiná-la.
Agora que você entende melhor como as máquinas enxergam… o que você criaria com essa tecnologia?
Fonte Original: Khan Academy - IA para Educação
Licença: Creative Commons Atribuição-Não Comercial-Compartilha Igual 3.0 (CC BY-NC-SA 3.0 US).

