Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Teknófilo

Publicado en: 10/08/2023 07:41

Escrito por: Teknófilo

Muchas webs no quieren que el rastreador de ChatGPT les visite: Podría acabar con ellas

Millones de personas utilizan Google diariamente, pero no muchas saben cómo llega la información de los sitios web hasta la base de datos del buscador. Aunque son desconocidas para muchos, hay arañas digitales rastreando los sitios web que lees y creas.
La araña más activa es probablemente Googlebot, que lee las páginas de los sitios web para que Google pueda clasificarla y ofrecerla en los resultados de búsqueda.
Así es como ha funcionado Internet en los últimos años, ya que es un modelo que beneficia a todos. Los usuarios encuentran la información que necesitan, Google gana dinero mostrando publicidad en sus resultados y los sitios web ganan dinero al recibir tráfico desde los buscadores hasta sus páginas con anuncios o contenido patrocinado.


La IA generativa está a punto de cambiar las búsquedas
Ahora, el auge de la IA generativa y de los grandes modelos lingüísticos está socavando este acuerdo. OpenAI admitió recientemente que tiene una de estas arañas rastreando la web.
Se llama GPTbot y se utiliza para raspar y recopilar contenidos para el entrenamiento de modelos de IA. Es probable que el próximo gran modelo, GPT-5, se entrene con los datos recogidos por este bot.
GPT-4, ChatGPT y otros potentes modelos de IA responden a las preguntas de los usuarios de forma inmediata, por lo que hay menos necesidad de enviar a los usuarios a las fuentes de la información original. Puede ser una gran experiencia para el usuario, pero los incentivos para compartir información gratuita de alta calidad por parte de los …

Top noticias del 10 de Agosto de 2023