DeepSeek-V3 presenta un reto atractivo para los líderes de IA

DeepSeek-V3, un nuevo modelo de inteligencia artificial desarrollado por una empresa china, ha sido lanzado esta semana. Este modelo cuenta con 671 mil millones de parámetros y está diseñado para democratizar el acceso a la inteligencia artificial, ofreciendo su uso de manera gratuita y local. Su llegada ha generado un gran interés y tensión en el sector, ya que desafía la supremacía de modelos cerrados como la serie GPT de OpenAI.
Las pruebas realizadas por la compañía indican que DeepSeek-V3 tiene un rendimiento destacado en varios idiomas, como inglés y chino, así como en programación y matemáticas. Su tamaño supera significativamente al de competidores como Llama 2 de Meta, que cuenta con 70 mil millones de parámetros, y Llama 3.1 con 405 mil millones, lo que podría ser un factor clave en su efectividad.
Los usuarios individuales pueden aprovechar este modelo a través de un chatbot gratuito que se encuentra disponible en el sitio web de DeepSeek. Esta herramienta no solo permite búsquedas en la web, sino que también ofrece información sobre el proceso de razonamiento del modelo, lo que enriquece la experiencia del usuario.
DeepSeek-V3 se caracteriza no solo por su rendimiento, comparable al de los llamados modelos frontera, sino también por su bajo costo. La empresa ha indicado que el entrenamiento del modelo costó apenas 5.5 millones de dólares, considerablemente menos que los más de 100 millones que se estima que OpenAI invirtió en el desarrollo de GPT-4.
Asimismo, la compañía ha anunciado que sus precios para servicios en línea son bastante competitivos, destacando que ofrecerán 1 millón de tokens a un precio promocional de solo 0.28 dólares, muy por debajo del costo de 10 dólares que tiene el uso de GPT-4.
Otro aspecto notable es la disponibilidad de DeepSeek-V3 para ser descargado y ejecutado localmente. Esto representa una ventaja clave para usuarios que valoran la privacidad de sus datos, quienes operan en áreas con acceso limitado a Internet o buscan un control más robusto sobre sus aplicaciones de inteligencia artificial.
A pesar de estas ventajas, el tamaño de DeepSeek-V3 plantea un desafío considerable para los usuarios en casa, ya que requiere hardware avanzado que supera las capacidades de ordenadores personales y smartphones. Es probable que muchos opten por utilizar el chatbot gratuito en lugar de intentar ejecutar el modelo localmente.
Aunque algunos informes han sugerido que es posible ejecutar DeepSeek-V3 en un clúster de ocho Apple Mac Mini Pro, cada uno con características de hardware avanzadas, el coste total de este equipo es significativamente alto, superando los 10,000 dólares, lo que limita su accesibilidad.
DeepSeek ha reconocido las limitaciones que implica el gran tamaño del modelo y su velocidad operativa menos que ideal, y han atribuido estos problemas a las restricciones actuales del hardware. Sin embargo, expresan optimismo de que futuros avances tecnológicos resolverán estos inconvenientes.
Finalmente, la compañía ha declarado que su objetivo a largo plazo es alcanzar la inteligencia general artificial mientras se mantiene un compromiso firme con el acceso abierto y la evolución sostenible de la inteligencia artificial.
Lee esto a continuación

Robots submarinos exploran el fascinante mundo bajo el agua
Los robots submarinos de Guangdong, con IA, inspeccionan hasta 400 metros y optimizan la exploración marina, mejorando la seguridad.

Virólogo alerta sobre el riesgo de pandemia por gripe aviar en Alemania
La gripe aviar en Alemania preocupa a expertos; Klaus Stoehr pide mejorar la preparación ante pandemias y vacunas.

Rescate espacial de China en 123 días con satélites autopilotados
China rescató dos satélites en 123 días tras un fallo de lanzamiento, demostrando avances en navegación espacial para futuras misiones.
