Noticias / #Asistentes

Noticias sobre #Asistentes

3 entradas con la etiqueta #Asistentes.

#37signals #AGI #API #Adobe #Adopción #Adquisiciones #Agentes #Alexa #Alucinaciones #Anthropic #Aplicaciones móviles #Aprendizaje #Arte Digital #Asistente #Asistentes #Automatización #Auténtico #ChatGPT #Claude #Coca-Cola #Colaboración #Contradicciones #Copyright #Creatividad #Cultura #Curso virtual #Código Abierto #Código abierto #Datasets #DeepMind #Derechos de autor #Desarrollo #Desarrollo Personal #Diseño #Economía #Educación #ElevenLabs #Equipo #Estoicismo #Estrategia #Eventos #Experiencia de Usuario #Filantropía #Filosofia #Foco #Formación #Futuro #Gemini #Geopolítica #Gestión #Gobernanza #Google #Google DeepMind #Grok #Hardware #Herramientas #Humildad #Imperfección #Imperfeción #Imágenes #Innovación #Inspiración #Interacción por Voz #Interoperabilidad #Investigación #JetBrains #LangChain #Llama #Mentores #Meta #Microsoft #Modelos #Música #No-code #OpenAI #OpenIA #Paradigma #Pensamiento Crítico #Pensamiento crítico #Periodismo #Perspectiva #Podcast #Prioridades #Problema #Procesos #Productividad #Programación #Propósito #Protocolo #Publicidad #Razonamiento #Realidad Aumentada #Realidad aumentada #Reflexiones #Regulación #Respeto #Runway #Sam Altman #Seguridad #Sesgo Cognitivo #Sesgos cognitivos #Startup #Tendencias #Tiempo #Transformación #Transparencia #Valor #Vibe Coding #Video #Voz #Wikipedia #YouTube #autonomía #creatividad #crecimiento #desarrollo software #diseño #educación #herramientas #hábitos #interoperabilidad #modelos multimodales #perseverancia #productividad #programación #propósito #responsabilidad #robótica #tendencias #Ética #ética
miércoles, 23 de abril de 2025

Grok, el asistente de IA de xAI, acaba de incorporar nuevas capacidades que permiten "ver" contenido en pantalla y cámara para usuarios de iOS. Esta función visual se complementa con soporte para chats de voz en múltiples idiomas más allá del inglés, junto con búsqueda en tiempo real mediante comandos de voz.

Estas actualizaciones posicionan a Grok en competencia más directa con Gemini Live y otras soluciones multimodales, mientras la IA de Elon Musk continúa reduciendo la brecha con sus competidores. La integración de capacidades visuales y vocales multilingües refleja la tendencia hacia asistentes de IA más versátiles e intuitivos.

Compartir:
viernes, 11 de abril de 2025

En una reciente aparición en el podcast Possible, Demis Hassabis, CEO de Google DeepMind, reveló que Google planea eventualmente combinar sus modelos de IA Gemini con sus modelos generadores de video Veo, con el objetivo de crear un asistente digital verdaderamente universal que comprenda mejor el mundo físico.

"Siempre construimos Gemini, nuestro modelo fundamental, para ser multimodal desde el principio", explicó Hassabis.

"La razón es que tenemos una visión para esta idea de un asistente digital universal, un asistente que realmente te ayude en el mundo real."

Esta integración representa la tendencia de la industria hacia modelos "omni" capaces de entender y sintetizar múltiples formas de medios simultáneamente.

Resulta fascinante que, según Hassabis, los modelos de video como Veo 2 ya pueden comprender la física del mundo simplemente observando videos de YouTube. "Básicamente, viendo muchos videos de YouTube, puede entender la física del mundo", comentó.

El objetivo final parece ser crear un asistente que no solo entienda el texto o las imágenes, sino que comprenda completamente el contexto físico tridimensional en el que vivimos, abriendo nuevas posibilidades para aplicaciones como la robótica y asistentes personales más sofisticados.

Compartir:
martes, 1 de abril de 2025

Amazon presentó Nova Act, un agente de IA de propósito general capaz de tomar control de un navegador web y realizar acciones simples de forma autónoma. Esta tecnología, desarrollada por el nuevo laboratorio de AGI de Amazon en San Francisco, también impulsará características clave de la próxima actualización Alexa+, aunque la versión actual se lanza como una "vista previa de investigación". Por ahora, esta herramienta solo está disponible en Estados Unidos.

"We think of agents as systems that can complete tasks and act in a range of digital and physical environments on behalf of the user. Today, such agents are still in an early stage. The Nova Act SDK is a crucial step forward, toward building reliable agents by enabling developers to break down complex workflows into atomic commands (e.g., search, checkout, answer questions about the screen). It also enables developers to add more detailed instructions to those commands where needed (e.g., "don't accept the insurance upsell"), call APIs, and more to further strengthen reliability."

Lo importante no es que Amazon sea el primero en este espacio (OpenAI y Anthropic ya tienen tecnologías similares), sino su potencial alcance masivo a través de Alexa. Si bien Amazon afirma que Nova Act supera a la competencia en pruebas internas, el verdadero desafío será resolver los problemas de fiabilidad que afectan a todos los agentes actuales: lentitud, limitada autonomía y errores que un humano no cometería.

Compartir: