Episodes
Shownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/
Published 02/15/24
### Promptologues * How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb * Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua ### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/ * embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain * A Guide to Large Language Model...
Published 02/09/24
Shownotes sur : https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/
Published 02/03/24
Shownotes sur : https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/
Published 01/26/24
https://bigdatahebdo.com/podcast/episode-180-quelques-news-pour-demarrer-2024/
Published 01/17/24
### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY * LightOn annonce la seconde version d’Alfred, son modèle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/ * Introducing Claude 2.1 -> https://www.anthropic.com/index/claude-2-1 * Welcome to the Hallucination Index! -> https://www.rungalileo.io/hallucinationindex ### data-engineering *...
Published 12/05/23
### LLM fever * Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123 * ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résult ats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter * Microsoft optimise Azure avec ses propres...
Published 11/27/23
* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power ### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm * Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf * Introducing Canopy: An easy, free, and flexible RAG...
Published 11/20/23
* ⚠️ Don't try this at home: CSS _as_ the backend - introducing Cascading Server Sheets! -> https://dev.to/thormeier/dont-try-this-at-home-css-as-the-backend-what-3oih ### LLM fever * Open AI Dev day 2024 -> https://openai.com/blog/new-models-and-developer-products-announced-at-devday * Knowledge Distillation: Principles, Algorithms, Applications -> https://neptune.ai/blog/knowledge-distillation * Quand la boîte noire des IA génératives livre ses secrets ->...
Published 11/13/23
### Data-science * XGBoost 2.0: New Tool for Training Better AI Models on More Complex Data -> https://aibusiness.com/ml/xgboost-2-0-new-tool-for-training-better-ai-models-on-more-complex-data * Semantic link in Microsoft Fabric: Bridging BI and Data Science -> https://blog.fabric.microsoft.com/en-us/blog/semantic-link-use-fabric-notebooks-and-power-bi-datasets-for-machine-learning-data-validation-and-more * Mastering Customer Segmentation with LLMs ->...
Published 10/30/23
### LLM fever* Zephyr 7B -> https://www.linkedin.com/posts/lewis-tunstall_heres-a-simple-recipe-to-train-a-7b-model-activity-7117523535991857152-LuYg/?utm_source=share&utm_medium=member_desktop * Bing Chat Enterprise -> Your AI-Powered Chat for Work | Bing Chat Enterprise (microsoft.com) * promptflow -> promptflow/examples/tutorials/e2e-development/chat-with-pdf.md at main · microsoft/promptflow (github.com) * n8n langchain ->...
Published 10/23/23
Linkedin Live avec Paul : Embeddings audio & image avec Serge Retkowsky -> https://www.linkedin.com/events/7101846404389580800/comments/ ### LLM* First Impressions with GPT-4V(ision) -> https://blog.roboflow.com/gpt-4-vision/ * Expanding access to safer AI with Amazon -> https://www.anthropic.com/index/anthropic-amazon * AutoGen: Enabling next-generation large language model applications ->...
Published 10/16/23
### LLM* Mistral 7B is here! -> https://mistral.ai/product/ * What's going on with the Open LLM Leaderboard? -> https://huggingface.co/blog/evaluating-mmlu-leaderboard * How do I use ChatGPT Browse with Bing to search the web? -> https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web * Meta AI assistant uses Microsoft Bing Search results -> https://searchengineland.com/meta-ai-assistant-uses-microsoft-bing-search-results-432565 *...
Published 10/10/23
* Modern Data Stack Meetup : Streamlit + Kestra ### Gen AI* Deploy Your LLM Chatbot With Retrieval Augmented Generation (RAG), llama2-70B (MosaicML inferences) and Vector Search -> https://www.databricks.com/resources/demos/tutorials/data-science-and-ai/lakehouse-ai-deploy-your-llm-chatbot?itm_data=demo_center * LLMs in Action: A Practical Guide for Software Architects and Developers ->...
Published 09/19/23
### Tools* Ruff -> https://beta.ruff.rs/docs/ ### Cloud* Mountpoint for Amazon S3 -> https://aws.amazon.com/blogs/aws/mountpoint-for-amazon-s3-generally-available-and-ready-for-production-workloads/ ### Time Series* Is Flux being deprecated with InfluxDB 3.0? -> https://community.influxdata.com/t/is-flux-being-deprecated-with-influxdb-3-0/30992/8?u=pauldix * Timeseries dans le podcast AWS en Français -> https://aws.amazon.com/fr/blogs/france/podcasts/ ### Database* Awesome...
Published 09/05/23
Dans cet épisode nous accueillons Ilyes Mehaddi de Snowflake pour nous parler de Snowflake Data Cloud et des annonces du Summit Retrouvez Ilyes sur le slack du bigdatahebdo ou alors sur son blog Data Cloud World Tour : 5 octobre à Paris Recap du Summit 2023 par secteurs d’activités Recap des annonces du Summit 2023 Sponsors Cette publication est sponsorisée par Affini-Tech et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour...
Published 07/27/23
Encore une fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverser Retrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/ # Orateurs * Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/) * Jérôme : [@jxerome](https://twitter.com/jxerome) et...
Published 07/24/23
Encore un fois cette année Quentin Ambard revient pour nous parler du Databricks Data + AI Summit. Episode en deux parties tant nous sommes bavard, et tant il avait de news à traverser Retrouvez les conférences du Data+AI Summit 2023 ici : https://www.databricks.com/dataaisummit/sessions/ # Orateurs * Vincent : [@vhe74](https://twitter.com/vhe74), [Affini-Tech](https://affini-tech.com/) et [Datatask](https://datatask.io/) * Jérôme : [@jxerome](https://twitter.com/jxerome) et...
Published 07/15/23
### Apéro* Voxxed Days Luxembourg -> * Numéros pour œuvres audiovisuelles -> https://www.arcep.fr/uploads/tx_gsavis/21-0532.pdf ### ML* Gladia -> http://app.gladia.io/ * Microsoft Orca 13B -> https://intelligence-artificielle.developpez.com/actu/345575/Microsoft-AI-presente-Orca-un-modele-a-13-milliards-de-parametres-qui-apprend-a-imiter-le-processus-de-raisonnement-des-grands-modeles-fondamentaux-ses-performances-egalent-celles-de-ChatGPT/ * Image Joint Embedding Predictive...
Published 07/08/23
Retour sur la MS Build 2023 avec Charles-Henri Sauget MVP Microsoft https://learn.microsoft.com/en-us/fabric/get-started/microsoft-fabric-overview Sponsors Cette publication est sponsorisée par [Affini-Tech](https://affini-tech.com/) et [CerenIT](https://www.cerenit.fr/). [CerenIT](https://www.cerenit.fr/) vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à...
Published 06/29/23
* Google I/O '23 in under 10 minutes -> https://www.youtube.com/watch?v=hleLlcHwQLM&list=TLGGCy91ScdjTPYyNjA1MjAyMw&index=2 * Google "We Have No Moat, And Neither Does OpenAI" -> https://www.semianalysis.com/p/google-we-have-no-moat-and-neither * Google demande à ses chercheurs d'arrêter de partager leurs travaux -> https://www.nextinpact.com/lebrief/71669/google-demande-a-ses-chercheurs-darreter-partager-leurs-travaux * Multilingual speech to text ->...
Published 06/01/23
Warp 10 sors dans sa version 3, Mathias Herberts est avec nous pour en parler Quelques blogs de la société Senx sur Warp 10 : https://blog.senx.io/tag/warp-10-3-x/ Mathias était déjà venu nous parler de Warp 10 dans l'épisode 72 (https://bigdatahebdo.com/podcast/episode-72-warp-10-avec-mathias-herberts/) Pour en savoir plus sur Foundation DB il y a l'épisode 93 (https://bigdatahebdo.com/podcast/episode-93-foundation-db/) Suivez Mathias Herberts sur Twitter :...
Published 05/24/23
### Apéro * Nouveau métier dans l'IA: C3PO -> https://podcast.ausha.co/le-podcast-des-eclaireurs/c3po-ce-metier-qui-va-sauver-les-journalistes ### GenAI * Microsoft JARVIS / HuggingGPT -> https://analyticsindiamag.com/microsoft-jarvis-is-the-path-towards-agi/ * New ways to manage your data in ChatGPT -> https://openai.com/blog/new-ways-to-manage-your-data-in-chatgpt ### Vector DB * What is a Vector Database? -> What is a Vector Database? - Zilliz Vector database learn *...
Published 05/09/23