Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Jedną z głównych różnic między @sunscreentech a innymi firmami zajmującymi się FHE jest to, że wybraliśmy bootstrapping obwodowy (CBS) zamiast bootstrappingu programowalnego (PBS) w naszym stosie technologicznym. Oto dlaczego to zrobiliśmy 👇🧵
Przede wszystkim, co to jest bootstrapping?
Bootstrapping to najbardziej zaawansowany i wymagający obliczeniowo komponent schematu FHE. Jest to technika, która pozwala na odświeżenie szyfrogramów, zasadniczo redukując nagromadzony szum z operacji homomorficznych i umożliwiając dalsze obliczenia.
Bootstrapping programowalny (używany przez @zama_fhe) odświeża szum i ocenia tabelę wyszukiwania w jednym kroku. Przyjmuje szyfrogram LWE jako wejście i zwraca nowy szyfrogram LWE, gotowy do następnego wyszukiwania. Latencja na bootstrapping jest niska, więc na izolowanych bramkach wygląda to atrakcyjnie. Wymiana to zależność sekwencyjna. Rzeczywiste programy wymagają łańcucha bootstraps, a liniowe zależności między tymi operacjami oznaczają, że obliczenia nie mogą być wykonywane równolegle. To pozostawia większość zasobów obliczeniowych (rdzeni) bezczynnych.
Bootstrapping obwodowy (używany przez @sunscreentech) podąża inną drogą. Bootstrapping nadal zużywa szyfrogram LWE, ale wyjściem jest „selekcja” GGSW zaprojektowana specjalnie do operacji CMUX. Każdy CMUX jest znacznie tańszy niż bootstrapping, a ponieważ drzewa CMUX są skrajnie równoległe, mogą być efektywnie rozdzielane między wiele zasobów obliczeniowych, zanim będzie wymagana kolejna kosztowna operacja bootstrappingu. Ta zmiana w strukturze zależności jest decydująca; pozwala naszemu czasowi wykonania saturacji wielu rdzeni CPU i GPU dzisiaj i czysto mapuje się na nadchodzące akceleratory FHE.
CMUX to szeroko stosowana podstawa w sprzęcie komputerowym, a zatem możemy wykorzystać dziesięciolecia pracy, aby umożliwić ogólne obliczenia z prostych części CMUX. Obwody PBS zazwyczaj wymagają specjalnego traktowania dla indeksowania negacyklicznego, wypełniania LUT i konwersji formatów, co wszystko spowalnia iterację i zwiększa powierzchnię na błędy. Należy jednak zauważyć, że tfhe-rs abstrahuje prawie całą tę pracę dla PBS, jeśli po prostu użyjesz ich domyślnych parametrów.
Wykorzystanie danych ma znaczenie, gdy obciążenia rosną. Selekcja GGSW wyprodukowana przez jeden CBS może napędzać wiele CMUX-ów, amortyzując kosztowny krok w szerokim podobwodzie. PBS nie oferuje porównywalnego ponownego wykorzystania; każda nowa bramka wiąże się z nowym bootstrappingiem.
Kiedy testowaliśmy pełną arytmetykę 16 i 32-bitową, pipeline CBS-CMUX konsekwentnie wykonywał się z mniejszą liczbą sekwencyjnych bootstraps i wyższą ogólną przepustowością. Te zyski poszerzają się w miarę wzrostu liczby rdzeni i są zgodne z naszą długoterminową mapą drogową sprzętową.
Dla naszego zespołu @sunscreentech, CBS dostarczył odpowiednią równowagę: przewidywalny równoległość, czystszą historię obliczeń i krzywą wydajności, która poprawia się wraz ze sprzętem zamiast zatrzymywać się w obliczeniach sekwencyjnych. Dlatego CBS jest fundamentem naszego stosu i dlatego nadal stawiamy na jego ekosystem.
1,5K
Najlepsze
Ranking
Ulubione