El drama en torno al código DMA-BUF para el controlador de IA de Habana Labs parece estar concluyendo con el ciclo de Linux 5.16 que se avecina.
Los cambios de controlador de Habana Labs se enviaron hoy por correo para ponerlos en cola en char / misc antes de la ventana de fusión de Linux 5.16 del próximo mes. Este controlador para admitir la inferencia de IA y los aceleradores de entrenamiento en la empresa propiedad de Intel tiene algunas actualizaciones interesantes para esta próxima versión del kernel.
Este verano probado para Linux 5.15 fue el soporte de exportación DMA-BUF para el controladorpero los desarrolladores de Direct Rendering Manager se opusieron fuertemente a los cambios de DMA-BUF. El problema de DMA-BUF se debe en última instancia a que el controlador del kernel de Habana Labs es de código abierto pero no tiene ningún cliente de espacio de usuario de código abierto para estresar y utilizar la interfaz como es un requisito para los controladores de GPU DRM.
Este problema se abordó finalmente en septiembre con Habana Labs abriendo el código a su compilador de IA y SynapseAI Core para que haya al menos alguna forma de "cliente" de código abierto que funcione en el espacio de usuario. Ahora que tiene ese código de espacio de usuario de código abierto, los cambios planeados en el controlador Habana Labs para Linux 5.16 incluyen la nueva API de espacio de usuario para que el controlador exporte un objeto DMA-BUF que es una región de memoria en la DRAM del acelerador.
Este soporte DMA-BUF en el controlador de IA de Habana Labs es necesario para admitir el intercambio de igual a igual a través de PCI Express con la intención de diseño de compartir búferes directamente entre el acelerador de entrenamiento de Gaudi y los adaptadores RDMA. Actualmente, los controladores Mellanox mlnx5 y AWS Elastic Fabric Adapter (efa) deberían estar listos para compartir DMA-BUF peer-to-peer desde el controlador de IA de Habana Labs.
Este controlador para Linux 5.16 ahora también expone más información de energía obtenida del firmware del hardware y hay varias otras correcciones y mejoras. La lista de mejoras planificadas del controlador Habana Labs para Linux 5.16 se puede encontrar a través de esta solicitud de extracción .
[Fuente]: phoronix.com
habana.( 18 de Octubre de 2021).logo habana lab svg.[Fotografía]. Modificado por jolhfred Recuperado de habana.ai
Anónimo.( 18 de Octubre de 2021).Pato Pingüino de software Libre Linux.[Fotografía]. Modificado por jolhfred Recuperado de pngfree.es