Episodes
Episódio extra falando sobre o lançamento do Llama 3!!!
Published 04/19/24
Published 04/19/24
Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs. Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo. Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede. Paper MoD:...
Published 04/18/24
Fala galera, esse é um primeiro episódio de uma série de episódios sobre PEFT, Parameter Efficient Fine Tuning. Nele eu falo sobre LoRA e QLoRA, que são 2 métodos muito importantes e amplamente utilizados que possibilitam o treinamento de LLMs bem mais rápido com o uso de apenas 1 GPU sem perder perfomance. Video sobre QLoRA: https://www.youtube.com/watch?v=6l8GZDPbFn8 LoRA paper: https://arxiv.org/pdf/2106.09685.pdf QLoRA paper: https://arxiv.org/pdf/2305.14314.pdf Instagram do...
Published 04/11/24
Fala galera, nesse expiódio eu falo sobre Retrieval Aware Fine Tuning (RAFT), um paper que propos uma nova técnica que utiliza tanto domain specific fine tuning quanto RAG pra melhorar a capacidade de recuperação da informação dos LLMs. Nesse epiódio eu também falo sobre um outro paper que também tem o nome de RAFT, mas dessa vez Reward rAnking Fine Tuning, que propoe uma nova técnica para fazer RLHF mas sem os problemas de convergencia de Reinforcement Learning. Retrieval Aware Fine...
Published 03/21/24
Fala galera, nesse episódio eu explico como a gente consegue escalar a janela de contexto de um LLM pra mais de 1 milhão de tokens usando Ring Attention. Além disso eu discuto se a abordagem usando RAG está morta com esses avanços na janela de contexto. Paper Lost in the Middle: https://arxiv.org/pdf/2307.03172.pdf Gemini technical report: https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf Paper Ring Attention: https://arxiv.org/pdf/2310.01889.pdf Instagram do...
Published 03/07/24
Fala galera, nesse episódio eu recebi o André, ele é AI expert na IBM e a gente falou bastante sobre como usar IA pra resolver diversos problemas na industria. Site da Brains: https://brains.dev/ Linkedin do Andre: https://www.linkedin.com/in/andrefelipelopes/ Linkedin da Brains: https://www.linkedin.com/company/brains-brazilian-ai-networks/ Instagram do podcast: https://www.instagram.com/podcast.lifewithai Linkedin do podcast: https://www.linkedin.com/company/life-with-ai
Published 02/22/24
Fala galera, nesse episódio eu falo sobre Mixture Of Experts e mais espeicificamente sobre o Mixtral, que hoje é o melhor LLM open source disponível e ele também é melhor que ChatGPT 3.5 e o Gemini Pro. Mixtral paper: https://arxiv.org/pdf/2401.04088.pdf Mixtral model: https://huggingface.co/mistralai/Mixtral-8x7B-v0.1 Mixtral YouTube: https://www.youtube.com/watch?v=mwO6v4BlgZQ Instagram: https://www.instagram.com/podcast.lifewithai Linkedin: https://www.linkedin.com/company/life-with-ai
Published 01/18/24
Fala galera, na versão em ingles do podcast eu entrevistei o Sergei e a gente falou bastante sobre NLP e mais especificamente o problem de Named Entity Recognition (NER). O Sergei e o time dele na NuMind publicaram um artigo sobre o modelo fundamental de NER deles que bateu e muito o estado da arte e a gente conversou sobre esse modelo na entrevista. Modelo em ingles: https://huggingface.co/numind/generic-entity_recognition_NER-v1 Modelo multi-language:...
Published 12/07/23
Fala galera, nesse episódio eu explico tudo que sei sobre Transformers. Falo da arquitetura, explico a formula de atenção, encoder, decoder, self-supervised learning, positional encoding, tokenisation, inductive bias, Vision-Transformers, receiptive fields... Foi o episódio mais tecnico que eu ja gravei e eu espero que voces gostem! Vale a pena escutar esse episódio com o paper do transformer aberto. Paper Transformers: https://arxiv.org/pdf/1706.03762.pdf Link do video explicando Next...
Published 11/30/23
Fala galera, nesse episódio eu explico o que é RAG (Retrieval Augmented Generation) e o conceito de agentes que executam tarefas. Instagram: https://www.instagram.com/podcast.lifewithai/  Linkedin: https://www.linkedin.com/company/life-with-ai
Published 11/16/23
Fala galera, nesse episódio eu entrevistei o Daniel, CTO da WeClever, e a gente conversou sobre como eles estão usando IA para melhorar a experiência dos chat bots. Durante a conversa a gente falou sobre fine tuning do ChatGPT, LoRA, RAG… foi uma conversa muito massa e eu espero que voces gostem! WeClever: https://www.linkedin.com/company/wecleverco/ Daniel Linkedin: https://www.linkedin.com/in/dmerlimorais/ Instagram: https://www.instagram.com/podcast.lifewithai/  Linkedin:...
Published 11/02/23
Fala galera, esse episódio ficou bem massa! Eu dou várias dicas tanto de entrevista tecnica quanto de entrevista comportamental. Na parte de entrevista tecnica eu falo do que mais cai e sempre é bom saber e também dos maiores erros tecnicos que as pessoas cometem nas entrevista e explico eles. Na parte comportamental eu falo um pouco sobre a visão do entrevistador do que não pode faltar! Aproveitem que esse episódio em portugues eu falei literalmente tudo, no episódio em ingles eu não pude...
Published 08/31/23
Fala galera, essa foi uma aula que eu dei em um evento falando sobre como treinar algoritmos de IA de maneira supervisionada e self-supervisionada, como funciona a tokenização do texto, como o ChatGPT foi treinado, falei também sobre inteligência de documento e algumas aplicações de IA. Foi um episódio bem denso em conteúdo e eu espero que voces gostem! Instagram: https://www.instagram.com/podcast.lifewithai/  Linkedin: https://www.linkedin.com/company/life-with-ai
Published 08/24/23
Fala galera, nesse episódio eu dou dicas de como extrair ao máximo do ChatGPT. Eu falo de técnicas como chain of thought, zero shot, few shot... Instagram: https://www.instagram.com/podcast.lifewithai/  Linkedin: https://www.linkedin.com/company/life-with-ai
Published 08/03/23
Fala galera, nesse episódio eu percorri o documento vazado sobre o GPT4 explicando diferentes pontos da arquitetura, treinamento, inferencia e dataset. O episódio ficou bem legal, curioso e um pouco técnico! Instagram: https://www.instagram.com/podcast.lifewithai/  Linkedin: https://www.linkedin.com/company/life-with-ai
Published 07/27/23
Fala galera, nesse episódio do podcast eu recebi o Juliemar, diretor de produto da Amicci e a gente conversou bastante sobre produtos de marca própria, marketplace e como usar as APIs da OpenAI pra criar seus próprios produtos. Na Amicci eles tem várias aplicações bem legais utilizando IA e o Juliemar falou um pouquinho sobre elas durante o episódio! Linkedin do Juliemar: https://www.linkedin.com/in/juliemarberri/ Site da Amicci: https://amicci.com.br/ LinkedIn do Podcast:...
Published 06/22/23
Fala galera, nesse episódio do podcast eu entrevistei o Vinicius, CEO da MadeinWEB. No episódio a gente falou bastante sobre transformação digital e o uso de IA no agro e na pecuária. Também falamos sobre como os serviços de nuvem (cloud) estão democratizando o acesso a tecnologia. LinkedIn do Vinicius: https://www.linkedin.com/in/vgallafrio/ LinkedIn da MadeinWeb: https://www.linkedin.com/company/madeinweb-mobile/ LinkedIn do podcast:...
Published 04/20/23
Fala galera, nesse episódio eu entrevistei o Rafael Lanna, CRO da Ewally, uma Fintech brasileira que atua no B2B, B2C e B2B2C. No episódio o Rafael falou sobre a história da Ewally, os diferentes serviços financeiros eles oferecem, o uso de IA para fazer uma análise de crédito para clientes da classe C e D e também sobre o futuro da empresa. LinkedIn do Rafael: https://www.linkedin.com/in/rafaellanna/ Website Ewally: https://www.ewally.com.br/ LinkedIn do podcast:...
Published 03/30/23
No episódio do podcast em inglês eu recebi o Krish Ramineni, Co-Founder e CEO da Fireflies, um assistente de reunião que transcreve o áudio e tem também um mecanismo de busca baseado em IA que te permite você ter uma recordação do que foi discutido. O buscador deles permite o usuário fazer diferentes tarefas  como sumarização (resumo), pesquisa de palavra chave, pesquisa por tópicos... Além disso, a Fireflies vai lançar daqui a pouco o chatGPT deles, chamado Fred. O Fred vai ser capaz de...
Published 02/09/23
Fala galera, nesse episódio em inglês eu recebi o Eric Olson, Co-fundador e CEO da Consensus, um buscador baseado em evidência. No episódio a gente discutiu vários aspectos técnicos de um buscador como os diferentes passos desde a sua pergunta até os links que são mostrados. Ele falou de técnicas como match de palavras chaves, similaridade do vetor de palavras e também de sistemas puros de IA utilizando Large Language Models para o problema de Q&A (pergunta e resposta). Buscador da...
Published 01/19/23
Fala galera, nesse episódio eu explico o famoso algoritmo ChatGPT. O ChatGPT é um chatbot desenvolvido pela OpenAI que consegue responder quase qualquer pergunta, seja pergunta livre, seja pergunta científica ou pergunta de código. O ChatGPT usa a GPT3 como backbone e também treinamentos supervisionados e por aprendizado por reforço usando o algoritmo PPO. ChatGPT: https://chat.openai.com Instagram: https://www.instagram.com/podcast.lifewithai/ Linkedin:...
Published 12/15/22
Fala galera, nesse episódio eu explico como funcionam os tokenizers. Eles basicamente possibilitam a gente entrar texto em algoritmos de NLP como BERT ou GPT. No episódio eu explico 3 tipos de tokenizers, baseado em palavra, baseado em caracteres e baseado e uma representação de sub-palavras. Instagram: https://www.instagram.com/podcast.lifewithai/ Linkedin: https://www.linkedin.com/company/life-with-ai Huuging Face blog sobre tokenizers:...
Published 12/01/22
Fala galera, no episódio em ingles do podcast eu gravei com o Guillaume sobre a Waalaxy, startup francesa que ele é COO. A Waalaxy é um CRM focado em LinkedIn e no episódio, além de ele explicar o produto, a gente falou sobre como aplicar IA no caso de uso deles e também como eles fizeram pra crescer em 3 anos de uma receita de 0 para uma receita anual recorrente de mais de 6 milhões de euro e os desafios pra contratar e reter talentos na área de tecnologia.    Link do episódio original em...
Published 10/20/22
Fala galera, nesse episódio eu falo sobre o problema de inteligência de documento, que é basicamente o meu trabalho na Qantev. A gente resolve 2 problemas usando algoritmos de inteligência de documento, o primeiro é o problema de extração de informação em documentos e o segundo é o problema de extração de tabela em documentos, onde basicamente extraímos a tabelo do documento para o formato CSV.  Instagram: https://www.instagram.com/podcast.lifewithai/   Linkedin:...
Published 10/07/22