Artigo original: Every single Machine Learning course on the internet, ranked by your reviews

Escrito por: David Venturi

Há um ano e meio, desisti de um dos melhores programas de Ciência da Computação do Canadá. Comecei a criar meu próprio programa de mestrado em ciência de dados utilizando recursos on-line. Percebi que podia aprender tudo o que precisava através da edX, do Coursera e da Udacity. Eu podia, inclusive, aprender mais rápido, de modo mais eficiente e por uma pequena parte do valor.

Estou quase terminando agora. Fiz muitos cursos relacionados à ciência de dados e conferi partes de muitos outros. Conheço as opções que estão por aí e quais habilidades são necessárias para os alunos se prepararem para o papel de analista de dados ou de cientista de dados. Assim, comecei a criar um guia de revisão que recomenda os melhores cursos para cada disciplina dentro da ciência de dados.

No primeiro guia desta série, recomendei algumas aulas de programação (texto em inglês) para o cientista de dados iniciante. Depois, foram as aulas de estatística e de probabilidade (texto em inglês). Em seguida, introdução à ciência de dados. Por fim, cursos de visualização de dados (texto em inglês).

Agora, vamos à aprendizagem da máquina.

Para este guia, passei várias horas tentando identificar cada curso de aprendizagem de máquina on-line oferecido a partir de maio de 2017, extraindo informações-chave de seus programas e análises de estudantes e compilando suas classificações. Meu objetivo final era identificar os três melhores cursos disponíveis e apresentá-los a você abaixo.

Para esta tarefa, recorri a ninguém menos do que a comunidade de código aberto da Class Central e ao seu banco de dados de milhares de classificações e análises de cursos.

1_u1dxHyShejSN3cgXGFQIAA
Página inicial do Class Central

Desde 2011, o fundador da Class Central, Dhawal Shah, vem se mantendo atento aos cursos on-line, mais do que qualquer outra pessoa no mundo. Dhawal me ajudou pessoalmente a montar esta lista de recursos.

Como escolhemos os cursos que avaliamos

Os cursos precisavam se enquadrar em três critérios:

  1. Deveriam ter uma quantidade significativa de conteúdo de aprendizagem de máquina: o ideal é que a aprendizagem de máquina seja o tópico principal. Observe que os cursos de aprendizagem profunda (do inglês, deep learning) são excluídos. Falaremos mais sobre isso depois.
  2. Deveriam ser sob demanda ou oferecidos em intervalos mensais curtos.
  3. Deveriam ser cursos on-line interativos – sem livros ou tutoriais somente de leitura: embora estes sejam modos viáveis de aprender, o guia se concentra nos cursos. Os cursos que são estritamente baseados em vídeo (isto é, sem questionários, tarefas etc.) também foram excluídos.

Acreditamos ter percorrido todos os cursos notáveis que se encaixam nos critérios acima. Como, aparentemente, existem centenas de cursos na Udemy, optamos por considerar apenas os mais analisados e bem cotados pelos alunos.

Sempre há, porém, a chance de que tenhamos perdido algo.

Como avaliamos os cursos

Compilamos as classificações médias e o número de análises da Class Central e de outros locais de revisão para calcular uma classificação média ponderada para cada curso. Lemos análises por texto e utilizamos este feedback para complementar as classificações numéricas.

Fizemos decisões subjetivas em termos do programa de cada curso com base em três fatores:

  1. Explicação do fluxo de trabalho de aprendizagem da máquina: o curso descreve os passos necessários para executar um projeto de sucesso em aprendizagem de máquina? Veja a próxima seção para saber o que implica um fluxo de trabalho típico.
  2. Tratamento das técnicas e dos algoritmos de aprendizagem de máquina: uma variedade de técnicas (por exemplo, regressão, classificação, agrupamento, etc.) e algoritmos (por exemplo, dentro da classificação: Naive Bayes, árvores de decisão, máquinas vetoriais de suporte etc.) são tratados ou apenas alguns poucos são selecionados? É dada preferência a cursos que cubram mais, sem poupar dos detalhes.
  3. Utilização de ferramentas comuns em ciência de dados e aprendizagem de máquina: o curso é ministrado usando linguagens de programação populares como Python, R e/ou Scala? As bibliotecas populares dentro dessas linguagens são examinadas? Embora não sejam necessárias, elas são úteis e, portanto, é dada uma ligeira preferência aos cursos que tratam dessas bibliotecas.

O que é aprendizagem de máquina? O que é um fluxo de trabalho?

Uma definição popular tem origem em uma declaração de Arthur Samuel, em 1959: aprendizagem de máquina é um subcampo da ciência da computação que "dá aos computadores a capacidade de aprender sem serem explicitamente programados". Na prática, isto significa desenvolver programas de computador que podem fazer previsões com base em dados. Assim como os humanos podem aprender com a experiência, os computadores também podem fazê-los, sendo que, neste caso dados equivalem à experiência.

Um fluxo de trabalho de aprendizagem de máquina é o processo necessário para a realização de um projeto de aprendizagem de máquina. Embora os projetos individuais possam diferir, a maioria dos fluxos de trabalho compartilha de várias tarefas comuns: avaliação de problemas, exploração dos dados, pré-processamento de dados, treinamento/teste/desenvolvimento de modelos etc. Abaixo, você encontrará uma visualização útil destas etapas principais:

1_KzmIUYPmxgEHhXX7SlbP4w
As etapas principais do fluxo de trabalho típico de aprendizagem de máquina, diagrama extraído da UpX Academy

O curso ideal introduz todo o processo e fornece exemplos interativos, tarefas e/ou questionários onde os alunos podem realizar cada tarefa por conta própria.

Estes cursos cobrem a aprendizagem profunda?

Em primeiro lugar, vamos definir a aprendizagem profunda, ou, em inglês, deep learning. Aqui está uma descrição sucinta:

"A aprendizagem profunda é um subcampo de aprendizagem de máquina preocupado com os algoritmos inspirados na estrutura e função do cérebro, chamados de redes neurais artificiais".

Jason Brownlee, do Domínio da Aprendizagem de Máquina

Como seria de se esperar, partes de alguns dos cursos de aprendizagem de máquina contêm conteúdo sobre aprendizagem profunda. No entanto, optei por não incluir cursos que sejam somente de aprendizagem profunda. Se você estiver interessado na aprendizagem profunda especificamente, temos este este artigo (texto em inglês) para você:

Minhas três principais recomendações nessa lista seriam:

Pré-requisitos recomendados

Vários cursos listados abaixo pedem aos estudantes que tenham experiência prévia em programação, cálculo, álgebra linear e estatística. Estes pré-requisitos são compreensíveis, dado que a aprendizagem da máquina é uma disciplina avançada.

Alguns desses assuntos não são familiares? Boas notícias! Parte desta experiência pode ser adquirida através de nossas recomendações nos dois primeiros artigos (o de programação e o de estatísticas – ambos os textos em inglês) deste Guia de Carreira em Ciência de Dados. Vários cursos de alto nível abaixo também fornecem revisões leves de cálculo e de álgebra linear e destacam os aspectos mais relevantes para a aprendizagem de máquina para os menos familiarizados.

Nossa escolha como o melhor curso de aprendizagem de máquina é...

Este curso da Universidade de Stanford na Coursera é, claramente, o vencedor atual em termos de classificação, análises e adequação do programa de estudos. Ensinado pelo famoso Andrew Ng, fundador do Google Brain e ex-cientista chefe da Baidu, essa foi a aula que acabou gerando a Coursera. Tem uma classificação média ponderada de 4,7 estrelas sobre 422 avaliações.

Lançado em 2011, ele cobre todos os aspectos do fluxo de trabalho de aprendizagem da máquina. Embora tenha um escopo menor do que a classe original de Stanford na qual se baseia, ainda consegue cobrir um grande número de técnicas e algoritmos. O tempo estimado de conclusão é de onze semanas, com duas semanas dedicadas às redes neurais e a aprendizagem profunda. Opções gratuitas e pagas estão disponíveis.

Andrew Ng é um instrutor dinâmico, mas gentil, com uma experiência palpável. Ele inspira confiança, especialmente ao compartilhar dicas práticas de implementação e avisos sobre armadilhas comuns. É fornecido uma revisão de álgebra linear e o autor destaca os aspectos de cálculo mais relevantes para a aprendizagem da máquina.

A avaliação é automática e feita através de questionários de múltipla escolha que seguem cada lição e tarefas de programação. As (oito) tarefas podem ser concluídas no MATLAB ou no Octave, que é uma versão de código aberto do MATLAB. Andrew Ng explica sua escolha de linguagem:

No passado, tentei ensinar a aprendizagem de máquina usando uma grande variedade de linguagens de programação, incluindo C++, Java, Python, NumPy e também o Octave... o que eu vi depois de ter ensinado a aprendizagem de máquina por quase uma década é que você aprende muito mais rápido se usar Octave como seu ambiente de programação.

Embora o Python e o R sejam, provavelmente, escolhas mais utilizadas com o aumento da popularidade dessas linguagens (texto em inglês), os comentários das análises observam que isso não deve impedi-lo de acompanhar o curso.

Alguns comentários de destaque observaram o seguinte:

De renome de longa data no mundo da MOOC, o curso de aprendizagem de máquina de Stanford é realmente a introdução definitiva ao tópico. O curso cobre amplamente todas as principais áreas da aprendizagem de máquina... o Prof. Ng precede cada segmento com uma discussão motivadora e exemplos.
Andrew Ng é um professor talentoso e capaz de explicar assuntos complicados de um modo muito intuitivo e claro, incluindo a matemática por trás de todos os conceitos.  Altamente recomendado.

O único problema que vejo com este curso é que ele estabelece expectativas muito altas para outros cursos em termos de comparação.

1_viCB-ayFFQi-4Fs_NYLVVQ

Uma nova introdução ao tema com um professor brilhante

Este é um curso relativamente novo que faz parte dos MicroMasters (em português, algo como "micromestrados") de Inteligência Artificial da edX. Embora seja mais novo e não tenha um grande número de análises, as que tem são excepcionalmente fortes. O professor John Paisley é mencionado como sendo brilhante, claro e inteligente. O curso tem uma classificação média ponderada de 4,8 estrelas em 10 análises.

O curso também cobre todos os aspectos do fluxo de aprendizagem da máquina e mais algoritmos do que a oferta da Stanford acima. O curso da Universidade de Columbia é uma introdução mais avançada, com os comentários observando que os alunos devem se sentir confortáveis com os pré-requisitos recomendados (cálculo, álgebra linear, estatística, probabilidade e programação).

Questionários (11), tarefas de programação (4) e um exame final são os modos de avaliação. Os alunos podem usar Python, Octave ou MATLAB para completar as tarefas. O tempo total estimado do curso é de oito a dez horas por semana durante doze semanas. Ele é gratuito com um certificado verificado disponível para compra.

Abaixo estão algumas das análises acima mencionadas:

Ao longo de todos os meus anos [como aluno] encontrei professores que não são brilhantes, professores que são brilhantes mas não sabem como explicar as coisas claramente e professores que são brilhantes e sabem como explicar as coisas claramente. O Dr. Paisley pertence ao terceiro grupo.
Este é um ótimo curso... a linguagem do instrutor é precisa e isso é, na minha opinião, um dos pontos mais fortes do curso. As palestras são de alta qualidade e os slides também são ótimos.

O Dr. Paisley e seu supervisor são ... alunos de Michael Jordan, o pai da aprendizagem de máquina. [Dr. Paisley] é o melhor professor de ML (Machine Learning - Aprendizagem de Máquina) de Columbia por causa de sua capacidade de explicar as coisas claramente. Em torno de 240 alunos selecionaram seu curso neste semestre, o maior número entre todos os professores [que ensinam] aprendizagem de máquina em Columbia.
1_q4Qa-kxC6MXFwct_9635ug

Uma introdução prática em Python e em R de especialistas do setor

Machine Learning A-Z™, da Udemy, é uma oferta impressionantemente detalhada, que fornece instrução tanto em Python quanto em R, o que é raro e não pode ser dito de nenhum dos outros cursos superiores. Tem uma classificação média ponderada de 4,5 estrelas, com 8.119 análises, o que o torna o curso mais analisado dentre os que revisamos.

Ele cobre todo o fluxo de aprendizagem da máquina e um número quase absurdo de algoritmos nas 40,5 horas de vídeo sob demanda. O curso tem uma abordagem mais aplicada e é mais leve em termos de matemática do que os dois cursos acima. Cada seção começa com um vídeo "intuitivo" de Eremenko, que resume a teoria subjacente do conceito que está sendo ensinado. Hadelin de Ponteves, então, mostra a implementação com vídeos separados, tanto para Python quanto para R.

Como "bônus", o curso inclui modelos de código em Python e em R para que os alunos possam baixar e utilizar em seus próprios projetos. Há questionários e desafios de lição de casa, embora estes não sejam os pontos fortes do curso.

Eremenko e a equipe da SuperDataScience são reverenciados por sua capacidade de "tornar o complexo simples". Além disso, os pré-requisitos listados são "apenas matemática do ensino médio". Portanto, este curso pode ser uma opção melhor para aqueles desencorajados com as ofertas de Stanford e de Columbia.

Algumas das análises mais destacadas observaram o seguinte:

O curso é produzido profissionalmente, a qualidade do som é excelente e as explicações são claras e concisas... é um valor incrível para seu investimento financeiro e de tempo.
Foi espetacular poder acompanhar o curso em duas linguagens de programação diferentes simultaneamente.
Kirill (Eremenko) é um dos melhores instrutores da Udemy (se não da internet) e eu recomendo que se faça qualquer aula que ele ensine. ... Este curso tem muito conteúdo, de verdade!
1_gl_KL2hhIkodQpznSzu8ZA

Os concorrentes

Nossa escolha número 1 teve uma classificação média ponderada de 4,7 de 5 estrelas em 422 análises. Vejamos as outras alternativas, ordenadas por classificação decrescente. Lembramos que cursos que sejam apenas de aprendizagem profunda não estão incluídos neste guia – você pode encontrá-los aqui (texto em inglês).

The Analytics Edge (Instituto de Tecnologia de Massachusetts/edX): mais focado na análise em geral, embora abranja vários tópicos de aprendizagem de máquina. Utiliza R. Narrativa forte, que aproveita exemplos familiares do mundo real. Desafiador. Dez a quinze horas por semana ao longo de doze semanas. Gratuito, com um certificado verificado disponível para compra. Tem uma classificação média ponderada de 4,9 estrelas em 214 análises.

Python for Data Science and Machine Learning Bootcamp (Jose Portilla/Udemy): tem grande parte do conteúdo de aprendizagem de máquina, mas cobre todo o processo de ciência de dados. Mais uma introdução muito detalhada ao Python. Curso surpreendente, embora não ideal para o escopo deste guia. 21,5 horas de vídeo sob demanda. O custo varia, dependendo dos descontos da Udemy, que são frequentes. Tem uma classificação média ponderada de 4,6 estrelas em 3316 análises.

Data Science and Machine Learning Bootcamp with R (Jose Portilla/Udemy): os comentários para o curso de Portilla acima também se aplicam aqui, exceto pelo fato de que o curso é em linguagem R. 17,5 horas de vídeo sob demanda. O custo varia, dependendo dos descontos da Udemy, que são frequentes. Tem uma classificação média ponderada de 4,6 estrelas em 1317 análises.

Machine Learning Series (Lazy Programmer Inc./Udemy): ensinado por um cientista de dados/engenheiro de software de big data/engenheiro de software full-stack com um currículo impressionante, Lazy Programmer tem atualmente uma série de 16 cursos focados na aprendizagem de máquina na Udemy. No total, os cursos têm mais de 5 mil classificações e quase todas elas têm 4,6 estrelas. A descrição de cada curso individual fornece um ordenamento útil do curso. Utiliza Python. O custo varia, dependendo dos descontos da Udemy, que são frequentes.

Machine Learning (Georgia Tech/Udacity): uma compilação do que eram três cursos separados: aprendizagem supervisionada, sem supervisão e aprendizagem de reforço. Parte do Nanodegree de Engenheiro de Aprendizagem de Máquina, da Udacity, e do mestrado on-line (OMS), da Georgia Tech. Os vídeos são curtos, como é o estilo da Udacity. Os professores são simpáticos. O tempo estimado é de quatro meses. Gratuito. Tem uma classificação média ponderada de 4,56 estrelas em 9 análises.

Implementing Predictive Analytics with Spark in Azure HDInsight (Microsoft/edX): introduz os conceitos centrais de aprendizagem de máquina e uma variedade de algoritmos. Tira proveito de várias grandes ferramentas de dados amigáveis, incluindo Apache Spark, Scala e Hadoop. Utiliza tanto Python, quanto R. Quatro horas por semana durante seis semanas. Gratuito com um certificado verificado disponível para compra. Tem uma classificação média ponderada de 4,5 estrelas em 6 análises.

Data Science and Machine Learning with Python — Hands On! (Frank Kane/Udemy): utiliza Python. Kane tem nove anos de experiência na Amazon e na IMDb. Nove horas de vídeo sob demanda. O custo varia, dependendo dos descontos da Udemy, que são frequentes. Tem uma classificação média ponderada de 4,5 estrelas em 4139 análises.

Scala and Spark for Big Data and Machine Learning (Jose Portilla/Udemy): o foco é em "Big Data", especificamente na implementação em Scala e Spark. Dez horas de vídeo sob demanda. O custo varia, dependendo dos descontos da Udemy, que são frequentes. Tem uma classificação média ponderada de 4,5 estrelas em 607 análises.

Machine Learning Engineer Nanodegree (Udacity): o principal programa de Machine Learning do Udacity, que apresenta o melhor sistema de análise de projetos e suporte de carreira. O programa é uma compilação de vários cursos individuais da Udacity, que são gratuitos. Co-criado pela Kaggle. Cronograma estimado de seis meses. Atualmente, custa US$ 199 por mês, com um reembolso de 50% da mensalidade disponível para aqueles que se formarem dentro de 12 meses. Tem uma classificação média ponderada de 4,5 estrelas em 2 análises.

Learning From Data (Introductory Machine Learning) (California Institute of Technology/edX): a inscrição está, atualmente, fechada na edX, mas também está disponível através da plataforma independente da CalTech (veja abaixo). Tem uma classificação média ponderada de 4,49 estrelas em 42 análises.

Learning From Data (Introductory Machine Learning) (Yaser Abu-Mostafa/California Institute of Technology): "um verdadeiro curso da Caltech, não uma versão diluída". As revisões observam que é excelente para entender a teoria da aprendizagem de máquina. O professor, Yaser Abu-Mostafa, é popular entre os estudantes e também escreveu o livro didático no qual este curso se baseia. Os vídeos são as aulas gravadas (com slides das aulas) e se encontram no YouTube. As tarefas de casa são arquivos em formato .pdf. A experiência do curso para estudantes on-line não é tão adequada quanto as três principais recomendações. Tem uma média ponderada de 4,43 estrelas em 7 análises.

Mining Massive Datasets (Universidade de Stanford): aprendizagem de máquina com foco em "Big Data". Introduz modernos sistemas de arquivos distribuídos e MapReduce. Dez horas por semana durante sete semanas. Gratuito. Tem uma classificação média ponderada de 4,4 estrelas em 30 análises.

AWS Machine Learning: A Complete Guide With Python (Chandra Lingam/Udemy): um foco único na aprendizagem de máquina baseado em nuvem e, especificamente, nos Amazon Web Services. Utiliza Python. Nove horas de vídeo sob demanda. O custo varia dependendo dos descontos da Udemy, que são frequentes. Tem uma classificação média ponderada de 4,4 estrelas em 62 análises.

Introduction to Machine Learning & Face Detection in Python (Holczer Balazs/Udemy): utiliza Python. Oito horas de vídeo sob demanda. O custo varia, dependendo dos descontos da Udemy, que são frequentes. Tem uma classificação média ponderada de 4,4 estrelas em 162 análises.

StatLearning: Statistical Learning (Universidade de Stanford): baseado no excelente livro didático, "An Introduction to Statistical Learning, with Applications in R" e ensinado pelos professores que o escreveram. Os revisores observam que o MOOC não é tão bom quanto o livro, citando exercícios "pouco desafiadores" e vídeos medíocres. Cinco horas por semana durante nove semanas. Gratuito. Tem uma classificação média ponderada de 4,35 estrelas em 84 análises.

Machine Learning Specialization (Universidade de Washington/Coursera): grandes cursos, mas as duas últimas aulas (incluindo o projeto final) foram canceladas. Os revisores observam que esta série é mais digerível (leia-se: mais fácil para aqueles sem formação técnica sólida) do que outros cursos de aprendizagem de máquina de ponta (por exemplo, o de Stanford ou o da Caltech). Esteja ciente de que a série está incompleta, sem os sistemas de recomendação, sem aprendizagem profunda e sem um resumo. Opções gratuitas e pagas disponíveis. Tem uma classificação média ponderada de 4,31 estrelas em 80 análises.

1_fgFqV9nyUKHi7txzgKcW4w
A Universidade de Washington ensina a Machine Learning Specialization na Coursera.

From 0 to 1: Machine Learning, NLP & Python-Cut to the Chase (Loony Corn/Udemy): "uma abordagem lúcida e breve, mas confiante, sobre as técnicas de aprendizagem de máquina". Ensinado por uma equipe de quatro pessoas com décadas de experiência no setor. Utiliza o Python. O custo varia dependendo dos descontos da Udemy, que são frequentes. Tem uma classificação média ponderada de 4,2 estrelas em 494 análises.

Principles of Machine Learning (Microsoft/edX): utiliza R, Python e a aprendizagem de máquina do Microsoft Azure. Parte do programa do certificado em Ciência de Dados da Microsoft Professional. Três a quatro horas por semana durante seis semanas. Gratuito com um certificado verificado disponível para compra. Tem uma classificação média ponderada de 4,09 estrelas em 11 análises.

Big Data: Statistical Inference and Machine Learning (Universidade de Tecnologia de Queensland/Aprendizagem Futura): um breve e agradável curso exploratório de aprendizagem de máquina, com foco em Big Data. Trata de algumas ferramentas, como R, H2O Flow e WEKA. Apenas três semanas de duração, com uma recomendação de duas horas por semana, mas um dos comentários observa que seis horas por semana seriam mais apropriadas. Opções gratuitas e pagas disponíveis. Tem uma classificação média ponderada de 4 estrelas em 4 análises.

Genomic Data Science and Clustering (Bioinformática V) (Universidade da Califórnia, San Diego/Coursera): para aqueles interessados na intersecção entre a informática e a biologia e em como ela representa uma importante fronteira na ciência moderna. Foca no clustering dos dados e na redução da dimensionalidade. Faz parte da especialização em Bioinformática da Universidade da Califórnia/San Diego. Opções gratuitas e pagas disponíveis. Tem uma classificação média ponderada de 4 estrelas em 3 análises.

Intro to Machine Learning (Udacity): prioriza a amplitude do tópico e as ferramentas práticas (em Python) em vez da profundidade e da teoria. Os instrutores, Sebastian Thrun e Katie Malone, tornam essa aula divertida. Consiste em vídeos curtos e questionários seguidos de um miniprojeto para cada aula. Atualmente, faz parte do Nanodegree de Analista de Dados, da Udacity. Tempo estimado de dez semanas. Gratuito. Tem uma classificação média ponderada de 3,95 estrelas em 19 análises.

Machine Learning for Data Analysis (Universidade Wesleyan/Coursera): uma breve introdução à aprendizagem de máquina e a alguns algoritmos selecionados. Abrange árvores de decisão, florestas aleatórias, regressão de laço e clustering de k-means. Parte da especialização em Análise de Dados e Interpretação, da Wesleyan. Tempo estimado de quatro semanas. Opções gratuitas e pagas disponíveis. Tem uma classificação média ponderada de 3,6 estrelas em 5 análises.

Programming with Python for Data Science (Microsoft/edX): produzido pela Microsoft em parceria com o Coding Dojo. Utiliza Python. Oito horas por semana durante seis semanas. Opções gratuitas e pagas disponíveis. Tem uma classificação média ponderada de 3,46 estrelas em 37 análises.

Machine Learning for Trading (Georgia Tech/Udacity): foca na aplicação de abordagens probabilísticas de aprendizagem de máquina para a tomada de decisões comerciais. Utiliza o Python. Faz parte do Nanodegree de Engenheiro de Aprendizagem de Máquina, da Udacity, e do OMS (mestrado on-line) da Georgia Tech. Tempo estimado de quatro meses. Gratuito. Tem uma classificação média ponderada de 3,29 estrelas em 14 análises.

Practical Machine Learning (Johns Hopkins University/Coursera): uma breve introdução prática a uma série de algoritmos de aprendizagem de máquina. Várias análises de uma ou duas estrelas expressando uma variedade de preocupações. Parte da especialização em ciência de dados da Johns Hopkins University. Quatro a nove horas por semana durante quatro semanas. Opções gratuitas e pagas disponíveis. Tem uma classificação média ponderada de 3,11 estrelas em 37 análises.

Machine Learning for Data Science and Analytics (Universidade Columbia/edX): introduz uma ampla gama de tópicos de aprendizagem de máquina. Algumas análises negativas fortes, com preocupações que incluem as escolhas de conteúdo, falta de tarefas de programação e apresentação pouco inspiradora. Sete a dez horas por semana durante cinco semanas. Gratuito, com um certificado verificado disponível para compra. Tem uma classificação média ponderada de 2,74 estrelas em 36 análises.

Recommender Systems Specialization (Universidade de Minnesota/Coursera): forte foco em um tipo específico de aprendizagem de máquina – sistemas de recomendação. Uma especialização de quatro cursos mais um projeto final, que é um estudo de caso. Ensinado usando o LensKit (um kit de ferramentas de código aberto para sistemas de recomendação). Opções gratuitas e pagas disponíveis. Tem uma classificação média ponderada de 2 estrelas em 2 análises.

Machine Learning With Big Data(Universidade da Califórnia, San Diego/Coursera): críticas fortes, que destacam instrução e avaliação deficientes. Alguns notaram que levaram apenas horas para completar o curso inteiro. Parte da Especialização em Big Data da UCSD. Opções gratuitas e pagas disponíveis. Tem uma classificação média ponderada de 1,86 estrela em 14 análises.

Practical Predictive Analytics: Models and Methods (Universidade de Washington/Coursera): uma breve introdução aos conceitos centrais de aprendizagem da máquina. Um dos comentários observou que não havia questionários e que as tarefas não eram desafiadoras. Parte da especialização em Ciência de Dados em escala, da Universidade de Washington. De seis a oito horas por semana durante quatro semanas. Opções gratuitas e pagas disponíveis. Tem uma classificação média ponderada de 1,75 estrelas em 4 análises.

Os cursos abaixo tiveram uma ou nenhuma revisão desde maio de 2017:

Machine Learning for Musicians and Artists (Goldsmiths, Universidade de Londres/Kadenze): único. Os estudantes aprendem algoritmos, ferramentas de software e melhores práticas de aprendizagem de máquina para dar sentido ao gesto humano, ao áudio musical e a outros dados em tempo real. Sete sessões de duração. Opções de auditoria (grátis) e premium ($10 USD por mês) disponíveis. Tem uma análise com 5 estrelas.

Applied Machine Learning in Python (Universidade de Michigan/Coursera): ensinado usando Python e o kit de ferramentas do scikit-learn. Parte da especialização em Ciência de Dados Aplicada com Python. Programado para começar em 29 de maio. Opções gratuitas e pagas disponíveis.

Applied Machine Learning (Microsoft/edX): ensinado usando várias ferramentas, incluindo Python, R e a aprendizagem de máquina do Microsoft Azure (observação: a Microsoft produz o curso). Inclui laboratórios práticos para reforçar o conteúdo das aulas. Três a quatro horas por semana durante seis semanas. Gratuito com um certificado verificado disponível para compra.

Machine Learning with Python (Big Data University): ensinado usando Python. Voltado para iniciantes. Tempo estimado de conclusão de quatro horas. A Big Data University é afiliada à IBM. Gratuito.

Machine Learning with Apache SystemML (Big Data University): ensinado utilizando o Apache SystemML, que é uma linguagem de estilo declarativa projetada para a aprendizagem de máquina em larga escala. Tempo estimado de conclusão de oito horas. A Big Data University é afiliada à IBM. Gratuito.

Machine Learning for Data Science (Universidade da Califórnia, San Diego/edX): não foi lançado até janeiro de 2018. Exemplos de programação e tarefas estão em Python, usando Jupyter Notebooks. Oito horas por semana durante dez semanas. Grauito com um certificado verificado disponível para compra.

Introduction to Analytics Modeling(Georgia Tech/edX): o curso anuncia R como sua principal ferramenta de programação. Cinco a dez horas por semana, durante dez semanas. Gratuito com um certificado verificado disponível para compra.

Predictive Analytics: Gaining Insights from Big Data (Queensland University of Technology/FutureLearn): breve visão geral de alguns algoritmos. Utiliza a plataforma Vertica Analytics da Hewlett Packard Enterprise como uma ferramenta aplicada. Data de início a ser anunciada. Duas horas por semana ao longo de quatro semanas. Gratuito com um certificado de conclusão disponível para compra.

Introducción al Machine Learning (Universitas Telefónica/Miríada X): ensinado em espanhol. Uma introdução à aprendizagem de máquina que abrange a aprendizagem supervisionada e não supervisionada. Um total de vinte horas estimadas em quatro semanas.

Machine Learning Path Step (Dataquest): ensinado em Python usando a plataforma interativa do Dataquest no navegador. Múltiplos projetos guiados e um projeto de bônus onde você cria seu próprio sistema de aprendizagem de máquina usando seus próprios dados. Assinatura necessária.

Os seis cursos a seguir são oferecidos pela DataCamp. O estilo de ensino híbrido da DataCamp aproveita a instrução baseada em vídeo e texto, com muitos exemplos através de um editor de código no navegador. Uma assinatura é necessária para o acesso total aos cursos.

1_eRUPgszpDHzEUpvXhFMeUg
A DataCamp oferece vários cursos de aprendizagem de máquina.

Introduction to Machine Learning(DataCamp): abrange algoritmos de classificação, regressão e agrupamento. Utiliza R. Quinze vídeos e 81 exercícios com um tempo estimado de seis horas.

Supervised Learning with scikit-learn (DataCamp): utiliza Python e scikit-learn. Trata de algoritmos de classificação e regressão. Dezessete vídeos e 54 exercícios com um tempo estimado de quatro horas.

Unsupervised Learning in R(DataCamp): fornece uma introdução básica ao clustering e redução da dimensionalidade em R. Dezesseis vídeos e 49 exercícios com um tempo estimado de quatro horas.

Machine Learning Toolbox (DataCamp): ensina as "grandes ideias" sobre aprendizagem de máquina. Utiliza R. 24 vídeos e 88 exercícios, com um tempo estimado de quatro horas.

Machine Learning with the Experts: School Budgets (DataCamp): um estudo de caso de uma competição de aprendizagem de máquina sobre DrivenData. Envolve a construção de um modelo para classificar automaticamente os itens no orçamento de uma escola. O curso "Supervised Learning with scikit-learn" da DataCamp é um pré-requisito. Quinze vídeos e 51 exercícios com um tempo estimado de quatro horas.

Unsupervised Learning in Python (DataCamp): trata de uma variedade de algoritmos de aprendizagem não supervisionada usando Python, scikit-learn e scipy. O curso termina com os alunos criando um sistema de recomendação para recomendar músicos populares. Treze vídeos e 52 exercícios com um tempo estimado de quatro horas.

Machine Learning (Tom Mitchell/Carnegie Mellon University): curso de iniciação à aprendizagem de máquina da Carnegie Mellon. Um pré-requisito para seu segundo curso de pós-graduação, "Statistical Machine Learning". Aulas de nível universitário com problemas práticos, tarefas de casa e uma avaliação de meio de semestre (todos com soluções) disponíveis on-line. Também há uma versão de 2011 do curso. A Carnegie Mellon University é uma das melhores escolas de pós-graduação para o estudo de aprendizagem de máquina e tem todo um departamento dedicado à área. Gratuito.

Statistical Machine Learning (Larry Wasserman/Carnegie Mellon University): provavelmente, o curso mais avançado deste guia. Um acompanhamento do curso Machine Learning, da Carnegie Mellon. Aulas de nível universitário com problemas práticos, tarefas de casa e uma avaliação de meio de semestre (todos com soluções) disponíveis on-line. Gratuito.

1_umqMeqC5Ch-kR1i4hPBTrw
A Carnegie Melon University é uma das melhores escolas de pós-graduação para o estudo de aprendizagem de máquina. Machine Learning e Statistical Machine Learning são os cursos disponíveis gratuitamente on-line.

Undergraduate Machine Learning (Nando de Freitas/Universidade de British Columbia): um curso de graduação em aprendizagem de máquina. As aulas são filmadas e colocadas no YouTube, com os slides postados no site do curso. As tarefas do curso também são postadas (mas sem as soluções). Nando de Freitas é agora professor em tempo integral na Universidade de Oxford e recebe elogios por sua capacidade de ensino em vários fóruns. Versão para pós-graduandos disponível (veja abaixo).

Machine Learning (Nando de Freitas/Universidade de British Columbia): um curso de pós-graduação em aprendizagem de máquina. Os comentários sobre o curso de graduação de Nando de Freitas (acima) também se aplicam aqui.

Para encerrar

Este é o quinto de uma série de seis artigos que tratam dos melhores cursos on-line para se lançar no campo da ciência dos dados. Tratamos de programação no primeiro artigo (texto em inglês), estatística e probabilidade no segundo artigo (texto em inglês), introdução a ciência de dados no terceiro artigo e visualização de dados no quarto (texto em inglês).

A parte final desta série será um resumo desses artigos, juntamente aos melhores cursos on-line para outros tópicos-chave, tais como discussão de dados, bancos de dados e até mesmo engenharia de software.

Se você estiver procurando uma lista completa de cursos on-line de Ciência de dados, você pode encontrá-los na página sobre Data Science and Big Data da Class Central.

Se você gostou de ler este texto, confira alguns outros artigos da Class Central (em inglês):

Here are 250 Ivy League courses you can take online right now for free

The 50 best free online university courses according to data

Esta é uma versão condensada do artigo original, publicado na Class Central, onde o autor incluiu um programa detalhado dos cursos.