Reddit anunció esta semana términos actualizados para herramientas y servicios para desarrolladores, ataque cuota a la API de datos de Reddit y más herramientas de moderación nativas.
Si acertadamente el blog de Reddit explicó los cambios como parte de la creación de un ecosistema saludable, el New York Times informó que el ataque cuota a la API impediría que las grandes empresas utilicen el contenido de Reddit para entrenar grandes modelos de estilo (LLM) de forma gratuita.
La documentación actualizada confirma que los desarrolladores solo pueden utilizar el contenido de Reddit para la formación de LLM con la aprobación previa de Reddit y que constituye un ataque comercial.
Bard no puede confirmar si Google incluyó contenido de Reddit en sus datos de entrenamiento como parte de los conjuntos de datos disponibles públicamente «probablemente utilizados».
ChatGPT no puede compartir una serie específica de fuentes, pero Reddit puede ser una de ellas.
Bing AI confirma que Microsoft utiliza múltiples fuentes de datos, incluido el índice y el operación de Bing con modelos OpenAI GPT.
Teniendo en cuenta que ChatGPT puede ocurrir utilizado datos de Reddit, se podría suponer que Microsoft incluso lo haya hecho, a través de su asociación con OpenAI.
¿Cuánto accederá a la API de datos de Reddit?
De acuerdo con los términos actualizados para desarrolladores, a partir del 19 de junio de 2023, Reddit cobrará por lo que considera ataque comercial y uso de la API:
- Si un negocio o servicio monetizado se conecta con la API, se considera ataque comercial.
- Si una empresa o servicio genera ingresos, directa o indirectamente, a partir de cualquier reseña de Reddit o datos derivados.
Los siguientes son ejemplos específicos de servicios monetizados de la página de la Plataforma para desarrolladores de Reddit:
- Servicios que generan ingresos a partir de anuncios y muros de cuota.
- Motores de búsqueda que generan ingresos a partir de anuncios.
- Servicios que cobran a los usuarios por el ataque a investigaciones o datos.
- Servicios por los cuales los usuarios pagan tarifas de suscripción.
- Servicios incluidos en la liquidación adicional de otro producto.
- Servicios que publican contenido de Reddit en sitios web y aplicaciones monetizados.
- Servicios que utilizan datos de Reddit para entrenar modelos.
Los investigadores que utilizan la API con fines no comerciales pueden continuar haciéndolo si aceptan no divulgar datos confidenciales de Reddit o productos creados con contenido de Reddit. El ataque a grandes volúmenes de datos puede ocasionar una tarifa para cubrir los costos asociados con el ataque masivo a la API.
Christopher Slowe, CTO de Reddit, comentó en una discusión en el subreddit de Machine Learning sobre las noticiario y escribió:
“Estamos entusiasmados con la investigación de LLM y ML y, en normal, muy orgullosos del papel que Reddit ha desempeñado en ese trabajo a lo amplio de los abriles. Entonces, si acertadamente necesitamos hacer más para asegurar que los datos de nuestros usuarios se compartan de forma responsable, no buscamos inhibir la investigación académica ni ingresar peculio con los investigadores”.
Los desarrolladores incluso deben recordar que el contenido del afortunado en Reddit pertenece a los usuarios y está sujeto a los derechos y restricciones de uso especificados por el afortunado. El acuerdo de afortunado confirma que los usuarios conservan los derechos sobre su contenido, pero incluso otorgan a Reddit una abuso franco de regalías para usarlo.
Reddit compartirá los detalles de los precios tan pronto como estén finalizados.
Reddit aseguró a los moderadores que los cambios de API no afectarán las herramientas que ayudan a hacer cumplir las reglas de subreddit y eliminar contenido que viole las políticas de Reddit.
Se anima a los moderadores a seguir el subreddit Mod News para mantenerse actualizados sobre los últimos avances en herramientas de moderación. Según se informa, Reddit se esfuerza por surtir una moderación comunitaria más estricta para surtir contentos a los anunciantes.
¿Reddit Data API será una útil de encargo de redes sociales?
Si utiliza alguna útil de terceros para propagar en Reddit, averiguar publicaciones en Reddit o crear informes analíticos para su cuenta de Reddit, hay tres formas en que esto podría afectarlo.
- Es posible que necesites más ataque a las funciones de Reddit a través de algunos servicios de terceros.
- Es posible que deba comenzar a fertilizar por algunos servicios de terceros que alguna vez ofrecieron planes de precios gratuitos para absorber el maduro costo de aceptar a la API de datos de Reddit.
- Es posible que deba fertilizar más de lo que ya paga por algunos servicios de terceros.
Veremos el impacto una vez que Reddit publique los detalles de los precios de la API. Las plataformas que se integran con Reddit incluyen Zapier, HootSuite, IFTTT, Feedly, Presencia Social, Tray.io y Social Rise. Estas plataformas permiten a los usuarios obtener información valiosa sobre la décimo en Reddit.
En cuanto a qué tipo de aumento podría esperar si su útil de encargo de redes sociales pasa el costo a sus usuarios: para servicios de terceros con más de un millón de usuarios, podría ser tan solo un dólar adicional por mes por afortunado. Para servicios con menos usuarios, podría ser mucho más.
Parte relacionadas: Cómo los cambios en la API de Twitter alteraron los servicios populares
Dos semanas luego de que los usuarios comenzaran a circular imágenes que implicaban precios empresariales para la API de Twitter, Twitter actualizó oficialmente su sitio web con planes de precios para el ataque premium a la API de Twitter v2.
Permite a los desarrolladores crear aplicaciones que recuperan y analizan datos de Twitter, lo que permite a estas herramientas averiguar Tweets sobre un tema específico, descubrir personas influyentes y crear informes analíticos sobre la audiencia y la décimo de una cuenta de Twitter.
El API Todavía permite que las aplicaciones publiquen actualizaciones en Twitter, lo que permite que las herramientas de dependencia de redes sociales programen y publiquen Tweets en una cuenta.
Twitter ofrece tres opciones de precios para APIv2.
Twitter invitó a los usuarios que necesitan más datos a solicitar API empresarial aceptar a través de un formulario de Google.
Las API empresariales ofrecen cobertura en tiempo efectivo de Tweets públicos con operadores y reglas específicos, filtrado de búsqueda avanzadilla, ataque histórico completo a Tweets archivados y actividad de cuentas de usuarios particulares (tweets, respuestas, seguimientos, me gusta, bloqueos, etc.).
Twitter no incluye precios para el ataque a la API de Twitter a nivel empresarial en su sitio web. A Pío compartido por Wired sugiere un rango de precios mensual de $42,000 a $210,000.
Aquí están los documentos. El “paquete holgado” cuesta 210.000 dólares al mes, o 2,5 millones de dólares al año (consejo @techmeme) https://t.co/RfGyWqpIgF pic.twitter.com/xuBiCBzoe7
— Chris Stokel-Walker ~ @stokel@infosec.exchange (@stokel) 10 de marzo de 2023
Según los usuarios de comunidades privadas de desarrolladores de Twitter que se han puesto en contacto con la plataforma para obtener más información, no ofrece ningún plan entre Elemental (a 100 dólares al mes) y Enterprise.
Twitter incluso depreciado versiones anteriores de la API, incluidos los niveles de ataque a la API Habitual (v1.1), Esencial (v2), Elevado (v2) y Premium.
El aumento de los costos y la depreciación del ataque afectaron a los siguientes servicios que dependían de la API de Twitter.
- Alertas meteorológicas que salvan vidas de varios servicios meteorológicos nacionales cuentas eran limitados.
- IFTTT, un servicio de automatización con 18 millones de usuarios, se topó asuntos con cambios de API realizados a principios de abril.
- Feedly, un servicio de lección de noticiario que integró funciones de inteligencia fabricado en 2020 para más de 18 millones de usuarios, retiró funciones de Twitter y comenzó a explorar integraciones con Mastodon.
- Flipboard, un servicio de agregación de noticiario con 145 millones de usuarios, anunció que los feeds de Twitter permanecerían roto y que Mastodon estaría en su futuro.
- HootSuite, una útil de encargo de redes sociales con 18 millones de usuarios, dejó de ofrecer planes gratuitos a los usuarios que gestionan Twitter y otros perfiles sociales.
Nos comunicamos con los creadores de varias herramientas populares de dependencia de redes sociales para solicitar comentarios. Hasta ahora, han dudado en comentar mientras trabajan con Twitter en soluciones personalizadas.
Elon Musk, director ejecutor de Twitter (Now X Corp), dijo que el ataque cuota a la API reduciría demasía de robots.
Todavía sugirió que la negativa de Microsoft a fertilizar las tarifas de la API de Twitter podría admitir a una demanda sumarial encima presuntamente “estafar la almohadilla de datos de Twitter” y “traicionar nuestros datos (de Twitter) a otros”.
GitHub, Microsoft y OpenAI se enfrentan a una demanda colectiva en San Francisco, California, por supuestamente usar el contenido enviado generado por los usuarios, violando varias directrices de abuso de código libre. Microsoft, GitHub y OpenAI han pedido que se desestime la demanda.
La misma empresa incluso presentó una demanda colectiva contra Stability AI, DeviantArt y Midjourney por utilizar Stable Diffusion, acusadas de utilizar arte con derechos de autor en sus datos de entrenamiento.
SEJ seguirá los desarrollos como lo harán otras empresas con grandes depósitos de datos públicos y conversaciones en el futuro en respuesta a que las empresas de IA los utilicen para datos de entrenamiento.
Imagen de portada: Dennis Diatel/Shutterstock