Umjetna inteligencijadb#1628

AI za oči: Chatbot nadmašuje listiće, ali tko to plaća?

(2w ago)
London, United Kingdom
medicalxpress.com
AI za oči: Chatbot nadmašuje listiće, ali tko to plaća?

AI za oči: Chatbot nadmašuje listiće, ali tko to plaća?📷 © Tech&Space

  • GPT-4o pobijedio Claude i Gemini u kliničkim pitanjima
  • Glasovni odgovori na 50 pitanja u desecima jezika
  • Bolnice još uvijek čekaju na implementaciju

Tim s University of East London i Moorfields Eye Hospital razvio je multijezični glasovni chatbot koji pacijentima objašnjava odvajanje mrežnice – ali s ključnom napomenom: testiran je na samo 50 pitanja, a najbolje rezultate postigao je GPT-4o, model koji većina bolnica ne koristi. Istraživanje, predvođeno dr.

Mohammad Hossein Amirhosseinijem i dr. Fatimom Kalabi, pokazalo je da AI može nadomjestiti statične listiće – ali samo ako se integrira u postojeće klinike, što je još uvijek otvoreno pitanje.

Ironično, upravo je retrieval-augmented generation (RAG) – tehnika koja spaja AI s verificiranim medicinskim izvorima – onaj dio koji čini ovaj pristup vjerodostojnim. Međutim, dok marketing naglašava 'multijezičnost' i 'pristupačnost', stvarni izazov leži u tome tko će platiti razvoj specijaliziranih modela za svaku bolnicu.

Prethodna istraživanja pokazuju da čak i najbolji AI alati zahtijevaju mjesecima finog tuninga prije nego što postanu korisni u praksi. Dok Gemini 1.5 Pro i Claude Opus nisu uspjeli nadmašiti GPT-4o u testovima, pitanje nije koje je rješenje 'najbolje', već koje je realno implementirati.

Bolnice već koriste jednostavnije alate kao što su chatboti za zakazivanje pregleda – ali ovdje se radi o kliničkoj odgovornosti, a to je druga liga.

Demo nasuprot deploymenta: Zašto najbolji benchmark ne znači spreman proizvod

Demo nasuprot deploymenta: Zašto najbolji benchmark ne znači spreman proizvod📷 © Tech&Space

Demo nasuprot deploymenta: Zašto najbolji benchmark ne znači spreman proizvod

Pravi signal ovdje nije u tome da AI 'mijenja edukaciju pacijenata' – to je već desetak godina obećano – već u činjenici da je prvi put testiran na konkretnom, životno opasnom stanju (odvajanje mrežnice zahtijeva hitnu operaciju). Međutim, čak i ovdje postoji jaz između benchmarka i stvarnog svijeta: chatbot je testiran na engleskim pitanjima, a multijezična podrška ostaje neprovjerena u praksi.

Slični projekti u drugim medicinskim oblastima pokazuju da prevodjenje medicinskih pojmova u realnom vremenu još uvijek ima grešku od 12-18% – a to je previše za urgentne slučajeve. Tko onda zapravo dobiva prednost?

Tehnološke kompanije koje prodaju RAG rješenja bolnicama, a ne pacijenti – barem ne odmah. Analiza tržišta upozorava da će do 2026. 80% AI projekata u zdravstvu ostati u pilot fazi zbog troškova održavanja.

Ovdje je ključno pitanje: hoće li bolnice kao Inselspital – koje su sudjelovale u istraživanju – uložiti u skaluiranje, ili će ovo ostati još jedan akademski proof-of-concept?

Konačno, važno je zapamtiti da AI nije zamjena za ljudsku inteligenciju i stručnost, već alat koji može pomoći u poboljšanju komunikacije i edukacije pacijenata. Stoga, potrebno je nastaviti istraživati i razvijati nove tehnologije koje će poboljšati komunikaciju u bolnicama i između pacijenata i liječnika. Time će se poboljšati kvaliteta zdravstvene skrbi i smanjiti mogući rizik od pogrešaka.

ChatbotBenchmarkingDeployment

//Comments

TECH & SPACE

An AI-driven editorial intelligence feed — not just aggregation. Every article is researched, rewritten and verified before publication. Built for readers who need signal, not noise.

// Powered by OpenClaw · Continuous publishing pipeline

// Mission

The internet drowns in press releases. We curate what actually matters — from peer-reviewed breakthroughs to industry shifts that don't make headlines yet.

Coverage across AI, Robotics, Space, Medicine, Gaming, Technology and Society. Updated around the clock.

© 2026 TECH & SPACE — All editorial content machine-verified.

Built with Next.js · Git pipeline · OpenClaw AI

AINvidia’s $4B optics bet signals AI infra arms raceMedicineAntibiotics disrupt gut microbiomes long-term in large studyAIOpenAI's nonprofit shell game finally hits the balance sheetRoboticsCanopii's 40,000-pound promise: indoor farming's hardware reality checkAIARC-AGI-3 reveals the distance between AI and human intuitionRoboticsChinese robot's 50-minute half-marathon raises more questions than recordsAIMicrosoft and OpenAI build AI that audits itselfRoboticsMIT’s hybrid AI cuts robot task planning time in halfAIDeepMind’s cognitive scaffolding for AGI measurementRoboticsAgibot ships 10,000 humanoids: scale meets skepticismAIAI’s benchmark gap revealed in real dev rejectionsGamingUSPTO shoots down Nintendo’s Pokémon patent playAIMost AI chatbots still help plan violence, study warnsGamingNvidia’s DLSS 4.5 turns fake frames into real funAISora joins ChatGPT: packaging or progress?SpaceRapidus and the Gravity of Off-World ManufacturingAIMeta’s Moltbook buy trails the agentic web hypeSocietyMeta, YouTube hit with $3M child harm damagesAISenate signs off on AI tools for official workAINvidia's $26B Open-Source Play: Infrastructure Meets IdeologyAIAnthropic vs. Pentagon: The AI safety fight Silicon Valley didn't expectAINvidia’s $4B optics bet signals AI infra arms raceMedicineAntibiotics disrupt gut microbiomes long-term in large studyAIOpenAI's nonprofit shell game finally hits the balance sheetRoboticsCanopii's 40,000-pound promise: indoor farming's hardware reality checkAIARC-AGI-3 reveals the distance between AI and human intuitionRoboticsChinese robot's 50-minute half-marathon raises more questions than recordsAIMicrosoft and OpenAI build AI that audits itselfRoboticsMIT’s hybrid AI cuts robot task planning time in halfAIDeepMind’s cognitive scaffolding for AGI measurementRoboticsAgibot ships 10,000 humanoids: scale meets skepticismAIAI’s benchmark gap revealed in real dev rejectionsGamingUSPTO shoots down Nintendo’s Pokémon patent playAIMost AI chatbots still help plan violence, study warnsGamingNvidia’s DLSS 4.5 turns fake frames into real funAISora joins ChatGPT: packaging or progress?SpaceRapidus and the Gravity of Off-World ManufacturingAIMeta’s Moltbook buy trails the agentic web hypeSocietyMeta, YouTube hit with $3M child harm damagesAISenate signs off on AI tools for official workAINvidia's $26B Open-Source Play: Infrastructure Meets IdeologyAIAnthropic vs. Pentagon: The AI safety fight Silicon Valley didn't expect
⊞ Foto Review