La IA transforma el navegador: llega la tercera guerra de los navegadores

IA reconfigurando el navegador: Prelude a la tercera guerra de los navegadores

La tercera guerra de los navegadores está ocurriendo en silencio. Al mirar hacia atrás en la historia, desde Netscape de los años 90, IE de Microsoft, hasta Firefox con espíritu de código abierto y Chrome de Google, la competencia de navegadores ha sido una representación concentrada del control de plataformas y el cambio de paradigmas tecnológicos. Chrome ha logrado la posición dominante gracias a su rapidez de actualización y su conexión con el ecosistema, mientras que Google ha formado un ciclo cerrado de entrada a la información a través de la estructura de "duopolio" de búsqueda y navegador.

Pero hoy, este patrón está siendo sacudido. La aparición de los modelos de lenguaje de gran tamaño (LLM) está llevando a que cada vez más usuarios completen tareas en la página de resultados de búsqueda con "cero clics", lo que reduce el comportamiento tradicional de hacer clic en páginas web. Al mismo tiempo, los rumores de que Apple podría reemplazar el motor de búsqueda predeterminado en Safari amenazan aún más la base de ganancias de Alphabet, y el mercado ha comenzado a mostrar inquietud hacia la "ortodoxia de las búsquedas".

El navegador en sí también se enfrenta a una reestructuración de roles. No solo es una herramienta para mostrar páginas web, sino que también es un contenedor de diversas capacidades como la entrada de datos, el comportamiento del usuario y la privacidad de la identidad. Aunque el Agente de IA es poderoso, para realizar interacciones complejas en la página, invocar datos de identidad local y controlar elementos de la página web, aún necesita apoyarse en los límites de confianza y el sandbox funcional del navegador. El navegador está pasando de ser una interfaz humana a convertirse en una plataforma de llamadas de sistema para Agentes.

Lo que realmente podría romper el actual paradigma del mercado de navegadores no es otro "mejor Chrome", sino una nueva estructura de interacción: no se trata de la presentación de información, sino de la invocación de tareas. Los navegadores del futuro deben ser diseñados para agentes de IA: no solo deben leer, sino también escribir y ejecutar. Proyectos como Browser Use están intentando semantizar la estructura de las páginas, convirtiendo la interfaz visual en texto estructurado que pueda ser invocado por LLM, logrando así una gran reducción en los costos de interacción.

Los proyectos principales en el mercado han comenzado a experimentar: Perplexity ha construido un navegador nativo llamado Comet, utilizando IA para reemplazar los resultados de búsqueda tradicionales; Brave combina la protección de la privacidad con la inferencia local, mejorando la búsqueda y las funciones de bloqueo con LLM; mientras que proyectos nativos de Crypto como Donut apuntan a nuevas entradas para la interacción entre IA y activos en cadena. La característica común de estos proyectos es que intentan reconstruir la entrada del navegador, en lugar de embellecer su capa de salida.

Para los emprendedores, las oportunidades se esconden en la relación triangular entre la entrada, la estructura y el agente. El navegador, como la interfaz del futuro para invocar al mundo, significa que quien pueda proporcionar "bloques de capacidad" estructurados, invocables y de confianza, podrá convertirse en parte de la nueva generación de plataformas. Desde SEO hasta AEO (Optimización del Motor de Agentes), desde el tráfico de páginas hasta la invocación de cadenas de tareas, tanto la forma del producto como el pensamiento de diseño están siendo reestructurados. La tercera guerra de los navegadores ocurre en la "entrada" y no en la "exhibición"; lo que decide la victoria ya no es quién atrae la atención del usuario, sino quién gana la confianza del agente y obtiene la puerta de entrada a la invocación.

Breve historia del desarrollo de los navegadores

A principios de la década de 1990, cuando Internet aún no formaba parte de la vida cotidiana, Netscape Navigator apareció en escena, como un barco que abre un nuevo continente, abriendo las puertas al mundo digital para millones de usuarios. Este navegador no fue el primero, pero sí fue el primero en el verdadero sentido de llegar al público en general y moldear la experiencia de Internet. En ese momento, las personas podían navegar por las páginas web con tanta facilidad a través de una interfaz gráfica, como si de repente todo el mundo se volviera al alcance de la mano.

Sin embargo, el esplendor a menudo es efímero. Microsoft pronto se dio cuenta de la importancia del navegador y decidió forzar la integración de Internet Explorer en el sistema operativo Windows, convirtiéndolo en el navegador predeterminado. Esta estrategia se puede considerar como un "asesino de plataformas", que desmanteló directamente la posición de liderazgo de Netscape en el mercado. Muchos usuarios no eligieron IE de forma activa, sino que lo aceptaron porque era la opción predeterminada del sistema. IE, aprovechando la capacidad de distribución de Windows, se convirtió rápidamente en el líder de la industria, mientras que Netscape cayó en una trayectoria de declive.

En tiempos de crisis, los ingenieros de Netscape eligieron un camino radical e idealista: hicieron público el código fuente del navegador, llamando a la comunidad de código abierto. Esta decisión fue como un "abdicación macedónica" en el mundo de la tecnología, presagiando el final de una era y el surgimiento de nuevas fuerzas. Este código se convirtió más tarde en la base del proyecto del navegador Mozilla, que se llamó inicialmente Phoenix (que significa renacimiento del fénix), pero debido a problemas de marca pasó por varios cambios de nombre, y finalmente se llamó Firefox.

Firefox no es una simple copia de Netscape; ha logrado múltiples avances en la experiencia del usuario, el ecosistema de complementos y la seguridad. Su creación marca la victoria del espíritu de código abierto y aporta nueva vitalidad a toda la industria. Algunos describen a Firefox como el "heredero espiritual" de Netscape, similar a cómo el Imperio Otomano heredó el resplandor de Bizancio. Esta metáfora, aunque exagerada, tiene un profundo significado.

Pero años antes del lanzamiento oficial de Firefox, Microsoft ya había lanzado seis versiones de IE, aprovechando la ventaja del tiempo y la estrategia de integración del sistema, lo que hizo que Firefox comenzara en una posición de desventaja, lo que hacía que esta competencia no fuera una competencia justa desde la misma línea de salida.

Al mismo tiempo, otro jugador temprano también apareció silenciosamente. En 1994, se lanzó el navegador Opera, que proviene de Noruega y al principio era solo un proyecto experimental. Pero a partir de la versión 7.0 de 2003, introdujo el motor Presto desarrollado internamente, siendo el primero en soportar tecnologías de vanguardia como CSS, diseño adaptable, control por voz y codificación Unicode. Aunque la cantidad de usuarios era limitada, siempre estuvo a la vanguardia de la industria en términos de tecnología, convirtiéndose en "el favorito de los geeks".

Ese mismo año, Apple lanzó el navegador Safari. Esta fue una vuelta de tuerca con un significado especial. En ese momento, Microsoft había invertido 150 millones de dólares en Apple, que estaba al borde de la quiebra, para mantener las apariencias competitivas y evitar una revisión antimonopolio. Aunque el motor de búsqueda predeterminado de Safari desde su creación fue Google, esta historia de enredos con Microsoft simboliza la compleja y sutil relación entre los gigantes de Internet: la cooperación y la competencia siempre van de la mano.

En 2007, IE7 se lanzó junto con Windows Vista, pero la respuesta del mercado fue mediocre. En cambio, Firefox, con un ritmo de actualizaciones más rápido, un mecanismo de extensiones más amigable y su atracción natural para los desarrolladores, vio cómo su cuota de mercado aumentaba constantemente hasta aproximadamente el 20%. El dominio de IE comenzó a debilitarse y la dirección del mercado estaba cambiando.

Google, por otro lado, tiene otra estrategia. Aunque comenzó a gestar su propio navegador en 2001, le tomó seis años convencer al CEO Eric Schmidt para aprobar el proyecto. Chrome se lanzó en 2008, construido sobre el proyecto de código abierto Chromium y el motor WebKit utilizado por Safari. Se le apodó el navegador "pesado", pero gracias a la profunda habilidad de Google en publicidad y construcción de marca, rápidamente se alzó.

La clave del éxito de Chrome no son sus funciones, sino la frecuencia de sus actualizaciones de versión (cada seis semanas) y una experiencia unificada en todas las plataformas. En noviembre de 2011, Chrome superó por primera vez a Firefox, alcanzando una cuota de mercado del 27%; seis meses después, superó nuevamente a IE, completando la transición de desafiante a dominante.

Mientras tanto, el internet móvil de China también está formando su propio ecosistema. El navegador UC, propiedad de una empresa, se volvió muy popular a principios de la década de 2010, especialmente en mercados emergentes como India, Indonesia y China, ganándose la preferencia de los usuarios de dispositivos de gama baja gracias a su diseño ligero y características como la compresión de datos para ahorrar ancho de banda. En 2015, su cuota de mercado global de navegadores móviles superó el 17%, llegando a alcanzar el 46% en India en un momento dado. Pero esta victoria no duró mucho. A medida que el gobierno indio intensificó la revisión de seguridad de las aplicaciones chinas, el navegador UC se vio obligado a retirarse de un mercado clave, perdiendo gradualmente su antiguo esplendor.

Al entrar en la década de 2020, la posición dominante de Chrome se ha consolidado, con una cuota de mercado global estable alrededor del 65%. Cabe destacar que, aunque el motor de búsqueda de Google y el navegador Chrome pertenecen a Alphabet, desde la perspectiva del mercado son dos sistemas hegemónicos independientes: el primero controla aproximadamente el noventa por ciento de los puntos de entrada de búsqueda en el mundo, mientras que el segundo tiene el control de la "primera ventana" a través de la cual la mayoría de los usuarios acceden a la red.

Para mantener esta estructura de doble monopolio, Google no escatima en gastos. En 2022, Alphabet pagó a Apple aproximadamente 20,000 millones de dólares solo para que Google mantuviera su posición de búsqueda predeterminada en Safari. Algunos análisis indican que este gasto equivale al 36% de los ingresos por anuncios de búsqueda que Google obtiene del tráfico de Safari. En otras palabras, Google está pagando una "cuota de protección" para su foso.

Pero la dirección del viento ha cambiado una vez más. Con el auge de los modelos de lenguaje de gran tamaño (LLM), la búsqueda tradicional comienza a verse afectada. En 2024, la cuota de mercado de búsqueda de Google cayó del 93% al 89%; aunque sigue dominando, las grietas comienzan a aparecer. Más disruptivo es el rumor de que Apple podría lanzar su propio motor de búsqueda de IA; si Safari cambiara su búsqueda predeterminada a su propio ecosistema, esto no solo reescribiría el panorama ecológico, sino que también podría sacudir el pilar de ganancias de Alphabet. La reacción del mercado fue rápida, y las acciones de Alphabet cayeron de 170 dólares a 140 dólares, reflejando no solo el pánico de los inversores, sino también una profunda inquietud sobre el futuro de la era de búsqueda.

Desde Navigator hasta Chrome, desde el ideal del código abierto hasta la comercialización de la publicidad, desde navegadores ligeros hasta asistentes de búsqueda AI, la batalla de los navegadores siempre ha sido una guerra sobre tecnología, plataformas, contenido y control. El campo de batalla se desplaza constantemente, pero la esencia nunca cambia: quien controla la entrada, define el futuro.

Desde la perspectiva de los VC, apoyándose en la nueva demanda de las personas por los motores de búsqueda en la era de LLM y AI, la tercera guerra de los navegadores se está desarrollando gradualmente. A continuación se presentan algunas de las situaciones de financiación de proyectos en el conocido sector de navegadores AI.

La arquitectura obsoleta de los navegadores modernos

Al hablar de la arquitectura del navegador, la clásica arquitectura tradicional se muestra en la siguiente imagen:

Cliente - Entrada del front-end

Consulta la entrega más reciente de Google Front End a través de HTTPS, completa la descifrado TLS, muestreo QoS y enrutamiento geográfico. Si se detecta tráfico anómalo (DDoS, scraping automático), se puede limitar el flujo o plantear un desafío en esta capa.

Consulta de Comprensión

El frontend necesita entender el significado de las palabras que el usuario teclea, y hay tres pasos: corrección ortográfica neuronal, corrigiendo "recpie" a "recipe"; expansión de sinónimos, expandiendo "how to fix bike" a "repair bicycle". Análisis de intención, determinando si la consulta es de información, navegación o intención de transacción, y asignando la solicitud Vertical.

Recuperación de candidatos

La técnica de consulta utilizada por un motor de búsqueda se llama: índice invertido. En el índice directo, se puede indexar un archivo simplemente dando un ID. Sin embargo, los usuarios no pueden conocer el número de contenido deseado entre miles de millones de archivos, por lo que se utiliza un índice invertido muy tradicional, que permite buscar qué archivos contienen las palabras clave correspondientes a través del contenido. A continuación, se utiliza el índice vectorial para manejar la búsqueda semántica, es decir, buscar contenido que sea similar en significado a la consulta. Convierte texto, imágenes y otros contenidos en vectores de alta dimensión (embedding) y realiza búsquedas basadas en la similitud entre estos vectores. Por ejemplo, incluso si un usuario busca "cómo hacer masa para pizza", el motor de búsqueda puede devolver resultados relacionados con "guía para hacer masa de pizza", ya que son semánticamente similares. Después de pasar por el índice invertido y el índice vectorial, se filtran inicialmente alrededor de cien mil páginas web.

Ordenación múltiple

Los sistemas suelen filtrar páginas candidatas de cientos de miles a aproximadamente 1000, utilizando características ligeras de miles de dimensiones como BM25, TF-IDF y puntuaciones de calidad de página, formando un conjunto de candidatos preliminar. Estos sistemas se conocen en conjunto como motores de recomendación. Dependen de una gran variedad de características generadas por múltiples entidades, incluyendo comportamiento del usuario, atributos de la página, intención de búsqueda y señales de contexto. Por ejemplo, un motor de búsqueda puede combinar el historial del usuario, la retroalimentación del comportamiento de otros usuarios, la semántica de la página, el significado de la consulta, entre otros, y también considerar elementos contextuales como el tiempo (horarios del día, días específicos de la semana) y eventos externos como noticias en tiempo real.

Ordenamiento principal con aprendizaje profundo

En la fase de búsqueda preliminar, un motor de búsqueda utiliza tecnologías como RankBrain y Neural Matching para comprender el significado de la consulta y filtrar resultados preliminarmente relevantes de una gran cantidad de documentos. RankBrain es un sistema de aprendizaje automático que la empresa introdujo en 2015, diseñado para comprender mejor el significado de las consultas de los usuarios, especialmente las consultas que aparecen por primera vez. Convierte las consultas y los documentos en representaciones vectoriales y calcula la similitud entre ellos para encontrar los resultados más relevantes. Por ejemplo, para la consulta "cómo hacer masa de pizza", incluso si no hay palabras clave que coincidan exactamente en el documento, RankBrain puede identificar contenido relacionado con "base de pizza" o "preparación de masa".

Neural Matching es otra tecnología lanzada por la compañía en 2018, diseñada para comprender más profundamente la relación semántica entre las consultas y los documentos. Utiliza modelos de redes neuronales para captar las relaciones difusas entre las palabras, ayudando a mejorar la coincidencia entre las consultas y el contenido de las páginas web. Por ejemplo, para la consulta "¿por qué mi

AGENT1.59%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
GasSavingMastervip
· 07-28 12:45
No entiendo por qué hay personas que todavía usan Safari.
Ver originalesResponder0
LiquidationWatchervip
· 07-27 20:48
Otra ronda de recortes ha comenzado
Ver originalesResponder0
MevWhisperervip
· 07-25 18:26
El viejo ie ya está condenado, es hora de chrome.
Ver originalesResponder0
CryptoDouble-O-Sevenvip
· 07-25 18:24
jugar con Firefox condenado
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)