Tecnología

Google presenta la actualización de Gemini 1.5 Pro, integración en YouTube y más

Hoy se dio la esperada conferencia de Google I/O con las novedades de la compañía, sobre todo la integración de su inteligencia artificial Gemini. De esta forma, el evento comenzó con la presentación de Sundar Pichai. La conferencia comenzó con la presentación de la nueva actualización de su IA Gemini 1.5 Pro que funciona con más de millón de tokens. Además, ya se encuentra disponible en dispositivos móviles Android y iOS.

Gemini funcionará con:

  • Google Photos: Podrás encontrar fotos con key words o incluso escribiendo una descripción como «Encuentra las fotos de mi hija Lucy nadando».
  • Workspace (Gmail, Docs, Sheets, Slides, Teammate y más): NotebookLM podrá crear una guía de estudio, un FAQ o un quiz. Puede crear conversaciones de audio para responder cualquier duda como una especie de «conversatorio» y sumar a más participantes. Se podrá buscar con base en una foto, audio o un texto una acción específica. Por ejemplo: Se sube una foto de unas zapatillas Converse y se menciona que se quiere devolver las zapatillas. Así, Gemini buscará el recibo en Gmail, el tipo de zapatillas y escogerá un día para la devolución en Google Calendar.
  • Google Chrome: Se agregarán aplicaciones IA a través de extensiones.
  • Buscador: Gemini proporcionará respuestas más exactas mediante AI Overviews en el primer párrafo de resultados. Además, otorgará links de dónde se sacó dicha información. Así como diversos lugares.
  • YouTube: A partir de imágenes y prompts se podrán buscar videos en la plataforma de videos. Y eso no es todo, ya que se podrá activar Gemini sobre YouTube para hacer preguntas sobre el video. De esta forma, la IA responderá respecto a lo que se informa en el video visto.
  • PDF: Se podrá subir archivos PDF a Gemini para que responda a preguntas sobre el documento.

También se mostró Gemini 1.5 Flash, una nueva IA más que funcionará más rápido y ligero que Gemini 1.5 Pro y que se está desarrollando para el nuevo Project Astra. De esta manera, se mostró cómo funcionará en el smartphone, se pedía que reconociera algo en el ambiente que emitiera sonido y le dijo que había un altavoz. Luego se activó un comando para dibujar en la transmisión y con una flecha preguntó cómo se llama una parte de este. Otra característica fue que puede leer lenguaje de código y explicar lo que sucede e incluso podrá reconocer dónde está el usuario tan solo con ver el lugar y recordar donde pusiste un objeto. Sin embargo, lo más interesante fue que también se podrá usar con lentes inteligentes a través de Gemini Live.

Y eso no es todo, ya que también se mencionó las nuevas IA generativa de Google DeepMind para generar imágenes, música y videos:

  • Image 3: Esta IAG de imagen crea imágenes más fotorealistas, mientras más específico sea el prompt. Además, todas las creaciones tendrán una marca de agua inteligente SynthID. También contará con texturas y diversas opciones.
  • Music AI Sandbox: Permitirá a los artistas, productores y compositores crear nuevas melodías con IAG. De esta forma, se podrá, por ejemplo, grabar ciertas notas con una guitarra y pedirle a esta IA que con esos acordes creer una melodía del género samba brasilera.
  • Veo: Permitirá crear videos a partir de prompts de texto o a partir de videos prompts. De esta forma, se puede especificar el estilo. Además, también se podrá extender el video si se necesita algunos segundos más.

También se mencionó la creación de Gems, una función para suscriptores de Gemini Advanced y así personalicen la IA dependiendo sus gustos. Es así, cómo se podrá dar una personalidad de estilista, entrenador personal o guía de escritura creativa. Los usuarios también pueden crear sus propios itinerarios teniendo anexado diversas páginas de vuelos aéreos, restaurantes y más. Por otro lado, está Gemini Nano para Google Pixel con multimodal, permitirá que los usuarios tengan mayor información sobre todo lo mencionado anteriormente. Será como un asistente inteligente que te podrá recomendar estilos de vestimenta, el clima a la hora de una citación y más. Finalmente, habrá actualizaciones en TalkBack, el servicio de accesibilidad al sistema operativo Android. Se mostrará un aviso de estafa cada vez que se identifique que un desconocido quiere engañar al usuario a través de una transferencia de dinero.

Compartir