Download do cccl - Download do código fonte cccl

cccl

C/C++

CCCL 2.6.1

Baixar

Guia do colaborador	Recipientes de dev	Discórdia	Godbolt	Projeto Github	Documentação

CUDA CORE COMPUTE BIBLIOTECAS (CCCL)

Bem -vindo às bibliotecas de computação do CUDA Core (CCCL), onde nossa missão é tornar o CUDA mais agradável.

Este repositório unifica três bibliotecas essenciais do CUDA C ++ em um repositório único e conveniente:

Impulso (antigo repositório)
Cub (ex -repositório)
libcudacxx (antigo repositório)

O objetivo do CCCL é fornecer aos desenvolvedores CUDA C ++ os blocos de construção que facilitam a redação de código seguro e eficiente. Reunindo essas bibliotecas simplifica seu processo de desenvolvimento e amplia sua capacidade de alavancar o poder do CUDA C ++. Para obter mais informações sobre a decisão de unificar esses projetos, consulte o anúncio aqui.

Visão geral

O conceito para as bibliotecas de computação do CUDA Core (CCCL) cresceu organicamente a partir de projetos que foram desenvolvidos independentemente ao longo dos anos com um objetivo semelhante: fornecer abstrações C ++ de alta qualidade, de alto desempenho e fáceis de usar para desenvolvedores de CUDA. Naturalmente, houve muita sobreposição entre os três projetos, e ficou claro que a comunidade seria melhor servida, unificando -os em um único repositório.

O impulso é a biblioteca de algoritmos paralela C ++ que inspirou a introdução de algoritmos paralelos na biblioteca padrão C ++. A interface de alto nível da Thrust aprimora bastante a produtividade do programador, permitindo a portabilidade do desempenho entre as GPUs e as CPUs multicore por meio de backnds configuráveis que permitem o uso de várias estruturas de programação paralelas (como CUDA, TBB e OpenMP).
O Cub é uma biblioteca específica de CUDA de nível inferior, projetada para algoritmos paralelos de velocidade de luz em todas as arquiteturas da GPU. Além dos algoritmos em todo o dispositivo, ele fornece algoritmos cooperativos , como redução em todo o bloco e varredura em toda a urdidura, fornecendo aos desenvolvedores do kernel da CUDA blocos de construção para criar kernels personalizados e de velocidade.
Libcudacxx é a biblioteca padrão CUDA C ++. Ele fornece uma implementação da biblioteca padrão C ++ que funciona no código do host e do dispositivo. Além disso, ele fornece abstrações para recursos de hardware específico do CUDA, como primitivas de sincronização, controle de cache, atômicos e muito mais.

O principal objetivo do CCCL é preencher uma função semelhante que a biblioteca C ++ padrão preencha para as ferramentas padrão de C ++: fornecer ferramentas de velocidade de uso geral para desenvolvedores de CUDA C ++, permitindo que eles se concentrem na solução dos problemas que importam. Unificar esses projetos é o primeiro passo para realizar esse objetivo.

Exemplo

Este é um exemplo simples demonstrando o uso da funcionalidade CCCL da impulso, Cub e Libcudacxx.

Ele mostra como usar o impulso/cub/libcudacxx para implementar um kernel de redução paralela simples. Cada bloco de thread calcula a soma de um subconjunto da matriz usando cub::BlockReduce . A soma de cada bloco é então reduzida a um único valor usando um atômico adicionado via cuda::atomic_ref de libcudacxx.

Em seguida, mostra como a mesma redução pode ser feita usando o algoritmo reduce do Thrust e compara os resultados.

Experimente ao vivo em Godbolt!

# include < thrust/execution_policy.h >
# include < thrust/device_vector.h >
# include < cub/block/block_reduce.cuh >
# include < cuda/atomic >
# include < cuda/cmath >
# include < cuda/std/span >
# include < cstdio >

template < int block_size>
__global__ void reduce (cuda::std::span< int const > data, cuda::std::span< int > result) {
  using BlockReduce = cub::BlockReduce< int , block_size>;
  __shared__ typename BlockReduce::TempStorage temp_storage;

  int const index = threadIdx. x + blockIdx. x * blockDim. x ;
  int sum = 0 ;
  if ( index < data. size ()) {
    sum += data[ index ];
  }
  sum = BlockReduce (temp_storage). Sum (sum);

  if (threadIdx. x == 0 ) {
    cuda::atomic_ref< int , cuda::thread_scope_device> atomic_result (result. front ());
    atomic_result. fetch_add (sum, cuda::memory_order_relaxed);
  }
}

int main () {

  // Allocate and initialize input data
  int const N = 1000 ;
  thrust::device_vector< int > data (N);
  thrust::fill (data. begin (), data. end (), 1 );

  // Allocate output data
  thrust::device_vector< int > kernel_result ( 1 );

  // Compute the sum reduction of `data` using a custom kernel
  constexpr int block_size = 256 ;
  int const num_blocks = cuda::ceil_div (N, block_size);
  reduce<block_size><<<num_blocks, block_size>>>(cuda::std::span< int const >( thrust::raw_pointer_cast (data. data ()), data. size ()),
                                                 cuda::std::span< int >( thrust::raw_pointer_cast (kernel_result. data ()), 1 ));

  auto const err = cudaDeviceSynchronize ();
  if (err != cudaSuccess) {
    std::cout << " Error: " << cudaGetErrorString (err) << std::endl;
    return - 1 ;
  }

  int const custom_result = kernel_result[ 0 ];

  // Compute the same sum reduction using Thrust
  int const thrust_result = thrust::reduce (thrust::device, data. begin (), data. end (), 0 );

  // Ensure the two solutions are identical
  std::printf ( " Custom kernel sum: %d n " , custom_result);
  std::printf ( " Thrust reduce sum: %d n " , thrust_result);
  assert (kernel_result[ 0 ] == thrust_result);
  return 0 ;
}

Começando

Usuários

Tudo no CCCL é apenas para cabeçalho. Portanto, os usuários precisam se preocupar apenas com a forma como obtêm os arquivos de cabeçalho e como os incorporam ao sistema de construção.

Kit de ferramentas CUDA

A maneira mais fácil de começar a usar o CCCL é através do CUDA Toolkit, que inclui os cabeçalhos do CCCL. Quando você compila com nvcc , ele adiciona automaticamente os cabeçalhos CCCL ao seu caminho de inclusão para que você possa simplesmente #include qualquer cabeçalho do CCCL no seu código, sem nenhuma configuração adicional necessária.

Se compilar com outro compilador, você precisará atualizar o caminho de pesquisa do seu sistema de compilação para apontar para os cabeçalhos do CCCL na instalação do CTK (por exemplo, /usr/local/cuda/include ).

# include < thrust/device_vector.h >
# include < cub/cub.cuh >
# include < cuda/std/atomic >

Github

Os usuários que desejam permanecer na vanguarda do desenvolvimento do CCCL são incentivados a usar o CCCL do GitHub. Usando uma versão mais recente do CCCL com uma versão mais antiga do kit de ferramentas CUDA é suportada, mas não o contrário. Para obter informações completas sobre a compatibilidade entre o CCCL e o CUDA Toolkit, consulte o suporte à nossa plataforma.

Tudo no CCCL é somente para o cabeçalho, então a clonagem e incluí-lo em um projeto simples é tão fácil quanto o seguinte:

git clone https://github.com/NVIDIA/cccl.git
nvcc -Icccl/thrust -Icccl/libcudacxx/include -Icccl/cub main.cu -o main

Nota Use -I e não -isystem para evitar colisões com os cabeçalhos do CCCL implicitamente incluídos pelo nvcc no kit de ferramentas CUDA. Todos os cabeçalhos do CCCL usam #pragma system_header para garantir que os avisos ainda sejam silenciados como se estivessem usando -isystem , consulte #527 para obter mais informações.

Instalação

Uma compilação mínima que gera apenas regras de instalação pode ser configurada usando a predefinição install do CMake:

git clone https://github.com/NVIDIA/cccl.git
cd cccl
cmake --preset install -DCMAKE_INSTALL_PREFIX=/usr/local/
cd build/install
ninja install

Para incluir bibliotecas experimentais na instalação, use o diretório de predefinição e construção de install-unstable .

Para instalar apenas as bibliotecas experimentais, use o diretório install-unstable-only de instalação e construção.

CONDA

O CCCL também fornece pacotes de CONDA de cada lançamento através do canal conda-forge :

conda config --add channels conda-forge
conda install cccl

Isso instalará o mais recente CCCL com o $CONDA_PREFIX/include/ $CONDA_PREFIX/lib/cmake/ DIRETORITOS. É descoberta pelo CMake via find_package(CCCL) e pode ser usado por quaisquer compiladores no ambiente do CONDA. Para mais informações, consulte esta introdução a Conde-Forge.

Se você deseja usar a mesma versão CCCL que enviou com um kit de ferramentas CUDA, por exemplo, CUDA 12.4, você pode instalar o CCCL com:

conda config --add channels conda-forge
conda install cuda-cccl cuda-version=12.4

O metapackage cuda-cccl instala a versão cccl enviada com o kit de ferramentas CUDA correspondente à cuda-version . Se você deseja atualizar para o cccl mais recente depois de instalar cuda-cccl , desinstale cuda-cccl antes de atualizar cccl :

conda uninstall cuda-cccl
conda install -c conda-forge cccl

Observe que também existem pacotes do CONDA com nomes como cuda-cccl_linux-64 . Esses pacotes contêm as versões CCCL enviadas como parte do kit de ferramentas CUDA, mas são projetadas para uso interno pelo kit de ferramentas CUDA. Instale cccl ou cuda-cccl , para compatibilidade com compiladores do CONDA. Para obter mais informações, consulte a receita do CCCL CONDA-FORGE.

Integração de cmake

O CCCL usa o CMake para toda a infraestrutura de compilação e instalação, incluindo testes, bem como alvos para vincular em outros projetos de CMake. Portanto, o Cmake é a maneira recomendada de integrar o CCCL em outro projeto.

Para um exemplo completo de como fazer isso usando o CMake Package Manager, consulte nosso projeto de exemplo básico.

Outros sistemas de construção devem funcionar, mas apenas o CMake é testado. As contribuições para simplificar a integração do CCCL em outros sistemas de construção são bem -vindas.

Colaboradores

Interessado em contribuir para melhorar o CCCL? Confira nosso guia contribuinte para obter uma visão geral abrangente de tudo o que você precisa saber para configurar seu ambiente de desenvolvimento, fazer alterações, executar testes e enviar um PR.

Suporte da plataforma

Objetivo: Esta seção descreve onde os usuários podem esperar que o CCCL compile e seja executado com sucesso.

Em geral, o CCCL deve trabalhar em todos os lugares em que o kit de ferramentas CUDA é suportado, no entanto, o diabo está nos detalhes. As seções abaixo descrevem os detalhes de suporte e teste para diferentes versões do kit de ferramentas CUDA, compiladores de host e dialetos C ++.

Compatibilidade do CUDA Toolkit (CTK)

Resumo:

A versão mais recente do CCCL é compatível com a série de versão principal do CTK atual e anterior
O CCCL nunca é compatível com qualquer versão do CTK. Sempre use o mesmo ou mais recente do que o incluído no seu CTK.
As atualizações menores da versão CCCL não quebram o código existente, mas novos recursos podem não suportar todas as versões do CTK

Os usuários da CCCL são incentivados a capitalizar os mais recentes aprimoramentos e "Live at Head", sempre usando a versão mais recente do CCCL. Para uma experiência perfeita, você pode atualizar o CCCL independentemente de todo o kit de ferramentas do CUDA. Isso é possível porque o CCCL mantém a compatibilidade com a versão mais recente do patch de cada liberação menor do CTK da série de versão principal atual e anterior. Em alguns casos excepcionais, a versão menor mínima suportada pelo lançamento do CUDA Toolkit pode precisar ser mais recente do que a versão mais antiga em sua principal série de versão. Por exemplo, o CCCL requer uma versão mínima suportada de 11.1 da série 11.x devido a uma questão inevitável do compilador presente no CTK 11.0.

Quando um novo CTK importante é lançado, lançamos suporte para a versão principal mais antiga suportada.

Versão CCCL	Suporta a versão CUDA Toolkit
2.x	11.1 - 11.8, 12.x (apenas as mais recentes lançamentos de patches)
3.x (futuro)	12.x, 13.x (apenas as mais recentes lançamentos de patches)

O código bem-comportado usando o CCCL mais recente deve compilar e executar com sucesso com qualquer versão CTK suportada. Exceções podem ocorrer para novos recursos que dependem dos novos recursos do CTK, para que esses recursos não funcionassem em versões mais antigas do CTK. Por exemplo, o suporte C ++ 20 não foi adicionado ao nvcc até o CUDA 12.0, portanto, os recursos do CCCL que dependem do C ++ 20 não funcionariam com o CTK 11.X.

Os usuários podem integrar uma versão mais recente do CCCL em um CTK mais antigo, mas não o contrário. Isso significa que uma versão mais antiga do CCCL não é compatível com um CTK mais recente. Em outras palavras, o CCCL nunca é compatível com o kit de ferramentas CUDA.

A tabela abaixo resume a compatibilidade do CTK e CCCL:

Versão ctk	Versão CCCL incluída	CCCL desejado	Suportado?	Notas
CTK `XY`	CCCL `MAJOR.MINOR`	Cccl `MAJOR.MINOR+n`	✅	Alguns novos recursos podem não funcionar
CTK `XY`	CCCL `MAJOR.MINOR`	CCCL `MAJOR+1.MINOR`	✅	Possíveis quebras; Alguns novos recursos podem não estar disponíveis
CTK `XY`	CCCL `MAJOR.MINOR`	CCCL `MAJOR+2.MINOR`		CCCL suporta apenas duas versões principais do CTK
CTK `XY`	CCCL `MAJOR.MINOR`	Cccl `MAJOR.MINOR-n`		CCCL não é compatível com a frente
CTK `XY`	CCCL `MAJOR.MINOR`	CCCL `MAJOR-n.MINOR`		CCCL não é compatível com a frente

Para obter mais informações sobre a versão do CCCL, a compatibilidade da API/ABI e as mudanças de quebra, consulte a seção de versão abaixo.

Sistemas operacionais

Salvo indicação em contrário, o CCCL suporta todos os mesmos sistemas operacionais que o CUDA Toolkit, que estão documentados aqui:

Linux
Windows

Compiladores de host

Salvo indicação em contrário, o CCCL suporta os mesmos compiladores de host que o mais recente kit de ferramentas CUDA, que estão documentados aqui:

Linux
Windows

Ao usar kits de ferramentas CUDA mais antigos, também suportamos apenas os compiladores host do mais recente kit de ferramentas do CUDA, mas pelo menos o compilador host mais recente de qualquer kit de ferramentas CUDA mais recente.

Podemos manter o apoio de compiladores adicionais e aceitaremos patches correspondentes da comunidade com correções razoáveis. Mas não investiremos um tempo significativo na trincagem ou na fixação de problemas para compiladores mais antigos.

No espírito de "Você só apóia o que testar", consulte nossa visão geral do CI para obter mais informações sobre exatamente o que testamos.

Dialetos C ++

C ++ 11 (descontinuado em impulso/filhote, a ser removido na próxima versão principal)
C ++ 14 (depreciado em impulso/filhote, a ser removido na próxima versão principal)
C ++ 17
C ++ 20

Arquiteturas de GPU

Salvo indicação em contrário, o CCCL suporta todos os mesmos recursos de arquiteturas/computação da GPU que o CUDA Toolkit, que estão documentados aqui: https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#compute-capability

Observe que alguns recursos podem suportar apenas determinadas arquiteturas/recursos de computação.

Estratégia de teste

A estratégia de teste da CCCL atinge um equilíbrio entre testar o maior número possível de configurações e a manutenção de tempos de IC razoáveis.

Para versões CUDA Toolkit, o teste é feito contra as versões mais antigas e mais recentes. Por exemplo, se a versão mais recente do kit de ferramentas CUDA for 12.3, os testes serão realizados contra 11.1 e 12.3. Para cada versão do CUDA, as compilações são concluídas contra todos os compiladores de host suportados com todos os dialetos C ++ suportados.

A estratégia de teste e a matriz estão em constante evolução. A matriz definida no arquivo ci/matrix.yaml é a fonte definitiva de verdade. Para obter mais informações sobre o nosso pipeline de IC, consulte aqui.

Versão

Objetivo: Esta seção descreve como o CCCL é versão em versão, garantias de estabilidade da API/ABI e diretrizes de compatibilidade para minimizar as dores de cabeça de atualização.

Resumo

A totalidade da API da CCCL compartilha uma versão semântica comum em todos os componentes
Somente a versão lançada mais recentemente é suportada e as correções não são de volta para lançamentos anteriores
As mudanças de quebra de API e o incremento da versão principal do CCCL só coincidirão com uma nova versão principal do CUDA Toolkit
Nem todas as mudanças de quebra de fonte são consideradas que quebram mudanças da API pública que justificam o aumento do número da versão principal
Não confie na estabilidade da ABI de entidades no cub:: ou thrust:: namespaces
As mudanças de quebra de ABI para símbolos no espaço de nome cuda:: podem acontecer a qualquer momento, mas serão refletidas incrementando a versão ABI que é incorporada em um espaço de nome em linha para todos os símbolos cuda:: . Várias versões da ABI podem ser suportadas simultaneamente.

Nota: Antes de mesclar a fusão, Cub e Libcudacxx nesse repositório, cada biblioteca foi de forma independente de acordo com a versão semântica. Começando com a versão 2.1, todas as três bibliotecas sincronizaram suas versões de liberação em seus repositórios separados. Avançando, o CCCL continuará sendo lançado sob uma única versão semântica, com 2.2.0 sendo a primeira versão do repositório NVIDIA/CCCL.

Breaking Change

Uma mudança de ruptura é uma alteração para funcionalidade explicitamente suportada entre versões lançadas que exigiriam que um usuário trabalhe para atualizar para a versão mais recente.

No limite, qualquer mudança tem o potencial de quebrar alguém em algum lugar. Como resultado, nem todas as alterações possíveis de quebra de fonte são consideradas mudanças na API pública que justificam a maior versão semântica.

As seções abaixo descrevem os detalhes de interromper as alterações na API e ABI da CCCL.

Interface de programação de aplicativos (API)

A API pública da CCCL é a totalidade da funcionalidade intencionalmente exposta para fornecer a utilidade da biblioteca.

Em outras palavras, a API pública da CCCL vai além de apenas assinaturas de funções e inclui (mas não se limita a):

A localização e os nomes dos cabeçalhos destinados à inclusão direta no código do usuário
Os espaços para nome destinados ao uso direto no código do usuário
As declarações e/ou definições de funções, classes e variáveis localizadas em cabeçalhos e destinadas ao uso direto no código do usuário
A semântica de funções, classes e variáveis destinadas ao uso direto no código do usuário

Além disso, a API pública da CCCL não inclui nenhum dos seguintes:

Qualquer símbolo prefixado com _ ou __
Qualquer símbolo cujo nome contém detail , incluindo o detail:: namespace ou uma macro
Qualquer arquivo de cabeçalho contido em um detail/ diretório ou subdiretório
Os arquivos do cabeçalho incluídos implicitamente por qualquer parte do cabeçalho da API pública

Em geral, o objetivo é evitar quebrar qualquer coisa na API pública. Tais alterações são feitas apenas se oferecer aos usuários um melhor desempenho, APIs mais fáceis de entender e/ou APIs mais consistentes.

Qualquer mudança de ruptura na API pública exigirá o número de versão principal da CCCL. De acordo com a compatibilidade da versão menor do CUDA, as mudanças de quebra de API e os principais solavancos da versão CCCL só ocorrerão coincidindo com uma nova versão principal da versão do kit de ferramentas CUDA.

Qualquer coisa que não parte da API pública possa mudar a qualquer momento sem aviso prévio.

Versão da API

A API pública de todos os componentes da CCCL compartilham uma versão semântica unificada do MAJOR.MINOR.PATCH .

Somente a versão mais recentemente lançada é suportada. Como regra, os recursos e as correções de bugs não são retrucados para a versão ou ramificações lançadas anteriormente.

O método preferido para consultar a versão é usar CCCL_[MAJOR/MINOR/PATCH_]VERSION conforme descrito abaixo. Para compatibilidade com versões anteriores, as definições da versão de impulso/cub/libcudacxxx estão disponíveis e sempre serão consistentes com CCCL_VERSION . Observe que o impulso/cub usa um esquema MMMmmmpp , enquanto o cccl e libcudacxx usam MMMmmmppp .

	Cccl	libcudacxx	Impulso	FILHOTE
Cabeçalho	`<cuda/version>`	`<cuda/std/version>`	`<thrust/version.h>`	`<cub/version.h>`
Versão principal	`CCCL_MAJOR_VERSION`	`_LIBCUDACXX_CUDA_API_VERSION_MAJOR`	`THRUST_MAJOR_VERSION`	`CUB_MAJOR_VERSION`
Versão menor	`CCCL_MINOR_VERSION`	`_LIBCUDACXX_CUDA_API_VERSION_MINOR`	`THRUST_MINOR_VERSION`	`CUB_MINOR_VERSION`
Versão de patch/subminador	`CCCL_PATCH_VERSION`	`_LIBCUDACXX_CUDA_API_VERSION_PATCH`	`THRUST_SUBMINOR_VERSION`	`CUB_SUBMINOR_VERSION`
Versão concatenada	`CCCL_VERSION (MMMmmmppp)`	`_LIBCUDACXX_CUDA_API_VERSION (MMMmmmppp)`	`THRUST_VERSION (MMMmmmpp)`	`CUB_VERSION (MMMmmmpp)`

Aplicativo Interface Binária (ABI)

A interface binária do aplicativo (ABI) é um conjunto de regras para:

Como os componentes de uma biblioteca são representados no código da máquina
Como esses componentes interagem em diferentes unidades de tradução

O ABI de uma biblioteca inclui, mas não está limitado a:

Os nomes mutilados de funções e tipos
O tamanho e o alinhamento de objetos e tipos
A semântica dos bytes na representação binária de um objeto

Uma mudança de quebra de ABI é qualquer alteração que resulte em uma alteração no ABI de uma função ou tipo na API pública. Por exemplo, adicionar um novo membro de dados a uma estrutura é uma mudança de quebra de ABI, pois altera o tamanho do tipo.

No CCCL, as garantias sobre a ABI são as seguintes:

Os símbolos no thrust:: e cub:: namespaces podem quebrar a ABI a qualquer momento sem aviso prévio.
O ABI de thrust:: e cub:: símbolos inclui as arquiteturas CUDA usadas para compilação. Portanto, um thrust:: ou cub:: símbolo pode ter um ABI diferente se:
- compilado com diferentes arquiteturas
- Compilado como um arquivo de origem CUDA ( -x cu ) vs C ++ Source ( -x cpp )
Os símbolos no espaço de nome cuda:: também podem quebrar a ABI a qualquer momento. No entanto, os símbolos cuda:: incorporam um número de versão da ABI que é incrementado sempre que ocorre uma quebra de ABI. Várias versões da ABI podem ser suportadas simultaneamente e, portanto, os usuários têm a opção de reverter para uma versão anterior da ABI. Para mais informações, consulte aqui.

Quem deve se preocupar com a ABI?

Em geral, os usuários do CCCL só precisam se preocupar com os problemas da ABI ao criar ou usar um artefato binário (como uma biblioteca compartilhada) cuja API inclui direta ou indiretamente os tipos fornecidos pelo CCCL.

Por exemplo, considere se libA.so foi construído usando o CCCL Versão X e sua API pública inclui uma função como:

 void foo (cuda::std::optional< int >);

Se outra biblioteca, libB.so , for compilada usando o CCCL Versão Y e usa foo do libA.so , isso pode falhar se houve uma quebra de ABI entre a versão X e Y Ao contrário das mudanças de quebra de API, as quebras de ABI geralmente não requerem alterações de código e exigem apenas recompilar tudo para usar a mesma versão da ABI.

Para saber mais sobre a ABI e por que é importante, veja o que é ABI e o que o C ++ deve fazer sobre isso?.

Diretrizes de compatibilidade

Como mencionado acima, nem todas as mudanças possíveis de quebra de fonte constituem uma mudança de ruptura que exigiria o número de versão principal da API da CCCL.

Os usuários são incentivados a aderir às seguintes diretrizes, a fim de minimizar o risco de interrupções de acidentalmente, dependendo de partes do CCCL que não fazem parte da API pública:

Não adicione nenhuma declaração ou especialize qualquer modelo de, o thrust:: , cub:: , nv:: ou cuda:: namespaces, a menos que uma exceção seja observada para um símbolo específico, por exemplo, especializar cuda::std::iterator_traits
- Justificativa : isso causaria conflitos se um símbolo ou especialização fosse adicionada com o mesmo nome.
Não tome o endereço de nenhuma API no thrust:: , cub:: , cuda:: ou nv:: namespaces.
- Justificativa : isso impediria a adição de sobrecarga dessas APIs.
Não declare a API no thrust:: , cub:: , cuda:: , ou nv:: namespaces.
- Justificativa : isso impediria a adição de sobrecarga dessas APIs.
Não faça referência diretamente a nenhum símbolo prefixado com _ , __ ou com detail em qualquer lugar em seu nome, incluindo um detail:: namespace ou macro
- Justificativa : Esses símbolos são apenas para uso interno e podem mudar a qualquer momento sem aviso prévio.
Inclua o que você usa. Para cada símbolo CCCL que você usa, diretamente #include o arquivo de cabeçalho que declara esse símbolo. Em outras palavras, não confie nos cabeçalhos implicitamente incluídos por outros cabeçalhos.
- Justificativa : Inclui interno pode mudar a qualquer momento.

Partes desta seção foram inspiradas nas diretrizes de compatibilidade de Abseil.

Política de depreciação

Faremos o possível para notificar os usuários antes de fazer alterações de quebra na API pública, ABI ou modificar as plataformas e compiladores suportados.

Conforme apropriado, as deprecações virão na forma de avisos programáticos que podem ser desativados.

O período de depreciação dependerá do impacto da mudança, mas geralmente dura pelo menos 2 liberações de versão menor.

Mapeamento para versões CTK

Em breve!

Visão geral do pipeline do CI

Para uma visão geral detalhada do pipeline do CI, consulte Ci-Overview.md.

Projetos relacionados

Projetos relacionados à missão da CCCL de tornar o CUDA mais agradável:

Cucollections - GPU acelerou estruturas de dados como tabelas de hash
NVBENCH - Biblioteca de benchmarking adaptada para aplicações CUDA
STDEXEC - Implementação de referência para remetentes Modelo de programação assíncrona

Projetos usando CCCL

Seu projeto usa o CCCL? Abra um PR para adicionar seu projeto a esta lista!

AMGX - Biblioteca de solucionador linear de várias grades
Colossalai - Ferramentas para escrever modelos de aprendizado profundo distribuídos
CUDF - Algoritmos e leitores de arquivos para análise de dados ETL
CuGraph - algoritmos para análise de gráficos
CUML - Algoritmos e primitivos de aprendizado de máquina
Cupy - Numpy & Scipy para GPU
Cusolver - solucionadores lineares densos e esparsos
Cuspacial - Algoritmos para operações geoespaciais
Pateta - Biblioteca para ajustes de probabilidade máxima
Motor de banco de dados pesado - SQL
Hoomd - Monte Carlo e simulações de dinâmica molecular
HUGETR - Estrutura de recomendação acelerada por GPU
Hydra - Análise de dados de física de alta energia
Hypre - solucionadores lineares multigrid
Lightseq - Treinamento e inferência para processamento e geração de sequência
MATX - Biblioteca de computação numérica usando modelos de expressão para fornecer sintaxe eficiente, tipo Python
Pytorch - cálculos de rede tensor e neural
Qiskit - Simulador de alto desempenho para circuitos quânticos
Quda - Computação de Cromodinâmica Quantum Lattice (QCD)
RAFT - Algoritmos e primitivos para aprendizado de máquina
Tensorflow-plataforma de ponta a ponta para aprendizado de máquina
Tensorrt - Inferência de aprendizado profundo
TSNE -CUDA - Biblioteca de incorporação de bairro estocástico
Visualization Toolkit (VTK) - Biblioteca de renderização e visualização
XGBOOST - Algoritmos de aprendizado de máquina de reforço de gradiente

Expandir

Informações adicionais

Versão CCCL 2.6.1
Tipo C/C++
Data da Última Atualização 2025-03-15
tamanho 9.64MB
Vindo de Github

Aplicativos Relacionados

DragonBonesCPP

2025-03-15
Beeftext

2025-03-15
networkit

2025-03-15
TensorflowASR

2025-03-16
libjson rpc cpp

2025-03-16
PEGTL

2025-03-15

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
DragonBonesCPP

C/C++

1.0.0
Beeftext

C/C++

v16.0
networkit

C/C++

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos