Retrouvez les liens de cet épisode dans les shownotes sur  https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi  ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France. Datatask vous accompagne dans tous vos projets Cloud et...
Published 04/29/24
Published 04/29/24
Retrouvez les liens de cet épisode dans les shownotes sur  https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France. Datatask vous accompagne dans tous vos projets Cloud et...
Published 04/22/24
Retrouvez les liens de cet épisode dans les shownotes sur  https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France. Datatask vous accompagne dans tous vos projets Cloud et...
Published 04/08/24
Retrouvez les liens de cet épisode dans les shownotes sur  https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France. Datatask vous accompagne dans tous vos projets Cloud et...
Published 03/29/24
Retrouvez les liens de cet épisode dans les shownotes sur  https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à [email protected] et retrouvez-nous aussi au Time Series France. Datatask vous accompagne dans tous vos projets Cloud et Data,...
Published 03/09/24
* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda * IA ACT * Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/ * From Silos to Standardization: Leveraging DBT for a Democratized Data Framework ->...
Published 03/01/24
Shownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/
Published 02/15/24
### Promptologues * How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb * Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua ### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/ * embedchain/embedchain: The Open Source RAG framework -> https://github.com/embedchain/embedchain * A Guide to Large Language Model...
Published 02/09/24
Shownotes sur : https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/
Published 02/03/24
Shownotes sur : https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/
Published 01/26/24
Published 01/17/24
### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY * LightOn annonce la seconde version d’Alfred, son modèle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/ * Introducing Claude 2.1 -> https://www.anthropic.com/index/claude-2-1 * Welcome to the Hallucination Index! -> https://www.rungalileo.io/hallucinationindex ### data-engineering *...
Published 12/05/23
### LLM fever * Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123 * ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résult ats -> https://generationia.flint.media/p/step-back-prompting-reculer-pour-mieux-sauter * Microsoft optimise Azure avec ses propres...
Published 11/27/23
* Why can't datacenter operators stop thinking about atomic power? -> https://www.theregister.com/2023/09/27/datacenters_nuclear_power ### LLM fever* Evaluate LLMs and RAG a practical example using Langchain and Hugging Face -> https://www.philschmid.de/evaluate-llm * Introducing the Giskard Bot: Enhancing LLM Testing & Debugging on Hugging Face -> https://huggingface.co/blog/JMJM/giskard-llm-testing-and-debugging-hf * Introducing Canopy: An easy, free, and flexible RAG...
Published 11/20/23
* ⚠️ Don't try this at home: CSS _as_ the backend - introducing Cascading Server Sheets! -> https://dev.to/thormeier/dont-try-this-at-home-css-as-the-backend-what-3oih ### LLM fever * Open AI Dev day 2024 -> https://openai.com/blog/new-models-and-developer-products-announced-at-devday * Knowledge Distillation: Principles, Algorithms, Applications -> https://neptune.ai/blog/knowledge-distillation * Quand la boîte noire des IA génératives livre ses secrets ->...
Published 11/13/23
### Data-science * XGBoost 2.0: New Tool for Training Better AI Models on More Complex Data -> https://aibusiness.com/ml/xgboost-2-0-new-tool-for-training-better-ai-models-on-more-complex-data * Semantic link in Microsoft Fabric: Bridging BI and Data Science -> https://blog.fabric.microsoft.com/en-us/blog/semantic-link-use-fabric-notebooks-and-power-bi-datasets-for-machine-learning-data-validation-and-more * Mastering Customer Segmentation with LLMs ->...
Published 10/30/23
### LLM fever* Zephyr 7B -> https://www.linkedin.com/posts/lewis-tunstall_heres-a-simple-recipe-to-train-a-7b-model-activity-7117523535991857152-LuYg/?utm_source=share&utm_medium=member_desktop * Bing Chat Enterprise -> Your AI-Powered Chat for Work | Bing Chat Enterprise (microsoft.com) * promptflow -> promptflow/examples/tutorials/e2e-development/chat-with-pdf.md at main · microsoft/promptflow (github.com) * n8n langchain ->...
Published 10/23/23
Linkedin Live avec Paul : Embeddings audio & image avec Serge Retkowsky -> https://www.linkedin.com/events/7101846404389580800/comments/ ### LLM* First Impressions with GPT-4V(ision) -> https://blog.roboflow.com/gpt-4-vision/ * Expanding access to safer AI with Amazon -> https://www.anthropic.com/index/anthropic-amazon * AutoGen: Enabling next-generation large language model applications ->...
Published 10/16/23
### LLM* Mistral 7B is here! -> https://mistral.ai/product/ * What's going on with the Open LLM Leaderboard? -> https://huggingface.co/blog/evaluating-mmlu-leaderboard * How do I use ChatGPT Browse with Bing to search the web? -> https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web * Meta AI assistant uses Microsoft Bing Search results -> https://searchengineland.com/meta-ai-assistant-uses-microsoft-bing-search-results-432565 *...
Published 10/10/23
* Modern Data Stack Meetup : Streamlit + Kestra ### Gen AI* Deploy Your LLM Chatbot With Retrieval Augmented Generation (RAG), llama2-70B (MosaicML inferences) and Vector Search -> https://www.databricks.com/resources/demos/tutorials/data-science-and-ai/lakehouse-ai-deploy-your-llm-chatbot?itm_data=demo_center * LLMs in Action: A Practical Guide for Software Architects and Developers ->...
Published 09/19/23
### Tools* Ruff -> https://beta.ruff.rs/docs/ ### Cloud* Mountpoint for Amazon S3 -> https://aws.amazon.com/blogs/aws/mountpoint-for-amazon-s3-generally-available-and-ready-for-production-workloads/ ### Time Series* Is Flux being deprecated with InfluxDB 3.0? -> https://community.influxdata.com/t/is-flux-being-deprecated-with-influxdb-3-0/30992/8?u=pauldix * Timeseries dans le podcast AWS en Français -> https://aws.amazon.com/fr/blogs/france/podcasts/ ### Database* Awesome...
Published 09/05/23