Enviar pesquisa
Carregar
ARM Compute Library
•
4 gostaram
•
1,770 visualizações
Mr. Vengineer
Seguir
ARM Compute Libraryについて
Leia menos
Leia mais
Dispositivos e hardware
Vista de apresentação de diapositivos
Denunciar
Compartilhar
Vista de apresentação de diapositivos
Denunciar
Compartilhar
1 de 15
Baixar agora
Baixar para ler offline
Recomendados
ARM CPUにおけるSIMDを用いた高速計算入門
ARM CPUにおけるSIMDを用いた高速計算入門
Fixstars Corporation
いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例
Fixstars Corporation
CXL_説明_公開用.pdf
CXL_説明_公開用.pdf
Yasunori Goto
20111015 勉強会 (PCIe / SR-IOV)
20111015 勉強会 (PCIe / SR-IOV)
Kentaro Ebisawa
携帯SoCでの画像処理とHalide
携帯SoCでの画像処理とHalide
Morpho, Inc.
Zynq mp勉強会資料
Zynq mp勉強会資料
一路 川染
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
Shinya Takamaeda-Y
Intro to SVE 富岳のA64FXを触ってみた
Intro to SVE 富岳のA64FXを触ってみた
MITSUNARI Shigeo
Recomendados
ARM CPUにおけるSIMDを用いた高速計算入門
ARM CPUにおけるSIMDを用いた高速計算入門
Fixstars Corporation
いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例
Fixstars Corporation
CXL_説明_公開用.pdf
CXL_説明_公開用.pdf
Yasunori Goto
20111015 勉強会 (PCIe / SR-IOV)
20111015 勉強会 (PCIe / SR-IOV)
Kentaro Ebisawa
携帯SoCでの画像処理とHalide
携帯SoCでの画像処理とHalide
Morpho, Inc.
Zynq mp勉強会資料
Zynq mp勉強会資料
一路 川染
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
Shinya Takamaeda-Y
Intro to SVE 富岳のA64FXを触ってみた
Intro to SVE 富岳のA64FXを触ってみた
MITSUNARI Shigeo
ARMアーキテクチャにおけるセキュリティ機構の紹介
ARMアーキテクチャにおけるセキュリティ機構の紹介
sounakano
CPU / GPU高速化セミナー!性能モデルの理論と実践:理論編
CPU / GPU高速化セミナー!性能モデルの理論と実践:理論編
Fixstars Corporation
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
MITSUNARI Shigeo
Qualcomm Hexagon SDK: Optimize Your Multimedia Solutions
Qualcomm Hexagon SDK: Optimize Your Multimedia Solutions
Qualcomm Developer Network
ARM LinuxのMMUはわかりにくい
ARM LinuxのMMUはわかりにくい
wata2ki
Master Canary Forging: 新しいスタックカナリア回避手法の提案 by 小池 悠生 - CODE BLUE 2015
Master Canary Forging: 新しいスタックカナリア回避手法の提案 by 小池 悠生 - CODE BLUE 2015
CODE BLUE
NEDIA_SNIA_CXL_講演資料.pdf
NEDIA_SNIA_CXL_講演資料.pdf
Yasunori Goto
不遇の標準ライブラリ - valarray
不遇の標準ライブラリ - valarray
Ryosuke839
SSE4.2の文字列処理命令の紹介
SSE4.2の文字列処理命令の紹介
MITSUNARI Shigeo
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
Takateru Yamagishi
P4によるデータプレーンプログラミングとユースケースのご紹介
P4によるデータプレーンプログラミングとユースケースのご紹介
Kumapone
Zynqで始めるUSB開発-FPGAとARMで動くUSBオーディオデバイスの実例とともに-
Zynqで始めるUSB開発-FPGAとARMで動くUSBオーディオデバイスの実例とともに-
mmitti
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
Fixstars Corporation
ARM Trusted FirmwareのBL31を単体で使う!
ARM Trusted FirmwareのBL31を単体で使う!
Mr. Vengineer
Spectre/Meltdownとその派生
Spectre/Meltdownとその派生
MITSUNARI Shigeo
今話題のいろいろなコンテナランタイムを比較してみた
今話題のいろいろなコンテナランタイムを比較してみた
Kohei Tokunaga
Sw技術者に送るfpga入門
Sw技術者に送るfpga入門
直久 住川
20分でわかるgVisor入門
20分でわかるgVisor入門
Shuji Yamada
カスタムメモリマネージャと高速なメモリアロケータについて
カスタムメモリマネージャと高速なメモリアロケータについて
alwei
"SRv6の現状と展望" ENOG53@上越
"SRv6の現状と展望" ENOG53@上越
Kentaro Ebisawa
Biases in military history
Biases in military history
Agha A
In the DOM, no one will hear you scream
In the DOM, no one will hear you scream
Mario Heiderich
Mais conteúdo relacionado
Mais procurados
ARMアーキテクチャにおけるセキュリティ機構の紹介
ARMアーキテクチャにおけるセキュリティ機構の紹介
sounakano
CPU / GPU高速化セミナー!性能モデルの理論と実践:理論編
CPU / GPU高速化セミナー!性能モデルの理論と実践:理論編
Fixstars Corporation
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
MITSUNARI Shigeo
Qualcomm Hexagon SDK: Optimize Your Multimedia Solutions
Qualcomm Hexagon SDK: Optimize Your Multimedia Solutions
Qualcomm Developer Network
ARM LinuxのMMUはわかりにくい
ARM LinuxのMMUはわかりにくい
wata2ki
Master Canary Forging: 新しいスタックカナリア回避手法の提案 by 小池 悠生 - CODE BLUE 2015
Master Canary Forging: 新しいスタックカナリア回避手法の提案 by 小池 悠生 - CODE BLUE 2015
CODE BLUE
NEDIA_SNIA_CXL_講演資料.pdf
NEDIA_SNIA_CXL_講演資料.pdf
Yasunori Goto
不遇の標準ライブラリ - valarray
不遇の標準ライブラリ - valarray
Ryosuke839
SSE4.2の文字列処理命令の紹介
SSE4.2の文字列処理命令の紹介
MITSUNARI Shigeo
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
Takateru Yamagishi
P4によるデータプレーンプログラミングとユースケースのご紹介
P4によるデータプレーンプログラミングとユースケースのご紹介
Kumapone
Zynqで始めるUSB開発-FPGAとARMで動くUSBオーディオデバイスの実例とともに-
Zynqで始めるUSB開発-FPGAとARMで動くUSBオーディオデバイスの実例とともに-
mmitti
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
Fixstars Corporation
ARM Trusted FirmwareのBL31を単体で使う!
ARM Trusted FirmwareのBL31を単体で使う!
Mr. Vengineer
Spectre/Meltdownとその派生
Spectre/Meltdownとその派生
MITSUNARI Shigeo
今話題のいろいろなコンテナランタイムを比較してみた
今話題のいろいろなコンテナランタイムを比較してみた
Kohei Tokunaga
Sw技術者に送るfpga入門
Sw技術者に送るfpga入門
直久 住川
20分でわかるgVisor入門
20分でわかるgVisor入門
Shuji Yamada
カスタムメモリマネージャと高速なメモリアロケータについて
カスタムメモリマネージャと高速なメモリアロケータについて
alwei
"SRv6の現状と展望" ENOG53@上越
"SRv6の現状と展望" ENOG53@上越
Kentaro Ebisawa
Mais procurados
(20)
ARMアーキテクチャにおけるセキュリティ機構の紹介
ARMアーキテクチャにおけるセキュリティ機構の紹介
CPU / GPU高速化セミナー!性能モデルの理論と実践:理論編
CPU / GPU高速化セミナー!性能モデルの理論と実践:理論編
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
準同型暗号の実装とMontgomery, Karatsuba, FFT の性能
Qualcomm Hexagon SDK: Optimize Your Multimedia Solutions
Qualcomm Hexagon SDK: Optimize Your Multimedia Solutions
ARM LinuxのMMUはわかりにくい
ARM LinuxのMMUはわかりにくい
Master Canary Forging: 新しいスタックカナリア回避手法の提案 by 小池 悠生 - CODE BLUE 2015
Master Canary Forging: 新しいスタックカナリア回避手法の提案 by 小池 悠生 - CODE BLUE 2015
NEDIA_SNIA_CXL_講演資料.pdf
NEDIA_SNIA_CXL_講演資料.pdf
不遇の標準ライブラリ - valarray
不遇の標準ライブラリ - valarray
SSE4.2の文字列処理命令の紹介
SSE4.2の文字列処理命令の紹介
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
CUDAのアセンブリ言語基礎のまとめ PTXとSASSの概説
P4によるデータプレーンプログラミングとユースケースのご紹介
P4によるデータプレーンプログラミングとユースケースのご紹介
Zynqで始めるUSB開発-FPGAとARMで動くUSBオーディオデバイスの実例とともに-
Zynqで始めるUSB開発-FPGAとARMで動くUSBオーディオデバイスの実例とともに-
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
CPU / GPU高速化セミナー!性能モデルの理論と実践:実践編
ARM Trusted FirmwareのBL31を単体で使う!
ARM Trusted FirmwareのBL31を単体で使う!
Spectre/Meltdownとその派生
Spectre/Meltdownとその派生
今話題のいろいろなコンテナランタイムを比較してみた
今話題のいろいろなコンテナランタイムを比較してみた
Sw技術者に送るfpga入門
Sw技術者に送るfpga入門
20分でわかるgVisor入門
20分でわかるgVisor入門
カスタムメモリマネージャと高速なメモリアロケータについて
カスタムメモリマネージャと高速なメモリアロケータについて
"SRv6の現状と展望" ENOG53@上越
"SRv6の現状と展望" ENOG53@上越
Destaque
Biases in military history
Biases in military history
Agha A
In the DOM, no one will hear you scream
In the DOM, no one will hear you scream
Mario Heiderich
グローバル理工人材のための今日から使える検索テクニック ―もう日本語でググるのはやめよう
グローバル理工人材のための今日から使える検索テクニック ―もう日本語でググるのはやめよう
Teng Tokoro
GroovyFX - Groove JavaFX
GroovyFX - Groove JavaFX
sascha_klein
Alejandro Fernandez vs Luis Miguel
Alejandro Fernandez vs Luis Miguel
Susana Gallardo
マイクロソフトが創る未来 医療編 20170401
マイクロソフトが創る未来 医療編 20170401
Aya Tokura
Green Behavior
Green Behavior
Alireza Ranjbar SHourabi
Elixir-Conf-Japan-2017-session-ohr486
Elixir-Conf-Japan-2017-session-ohr486
Tsunenori Oohara
Tercera Trobada #Xatac5a Tarragona
Tercera Trobada #Xatac5a Tarragona
Neus Lorenzo
A deep dive into Drupal 8 routing
A deep dive into Drupal 8 routing
Naveen Valecha
フェーズI/IIに置けるベイジアン・アダプティブ・メソッド
フェーズI/IIに置けるベイジアン・アダプティブ・メソッド
Yoshitake Takebayashi
Marketing's important. But marketers often aren't.
Marketing's important. But marketers often aren't.
London Business School
Immunisation against bacteria
Immunisation against bacteria
Rohit Satyam
Mr. Nitin bassi IEWP @ 2nd India-EU Water Forum @ World Sustainable Developme...
Mr. Nitin bassi IEWP @ 2nd India-EU Water Forum @ World Sustainable Developme...
India-EU Water Partnership
A Building Framework for the All Renewable Energy Future
A Building Framework for the All Renewable Energy Future
Bronwyn Barry
Wasabi waiter game - Gamification in recruitment - Manu Melwin Joy
Wasabi waiter game - Gamification in recruitment - Manu Melwin Joy
manumelwin
Frank Michael encore un peu plus riche
Frank Michael encore un peu plus riche
Thierry Debels
Experience WOW. A new benchmark in MDP / EDP
Experience WOW. A new benchmark in MDP / EDP
Pravin Rajpal
Critiques of Community Forestry
Critiques of Community Forestry
amulya123
Groeispurt voor bvba kunstenaar Koen Vanmechelen
Groeispurt voor bvba kunstenaar Koen Vanmechelen
Thierry Debels
Destaque
(20)
Biases in military history
Biases in military history
In the DOM, no one will hear you scream
In the DOM, no one will hear you scream
グローバル理工人材のための今日から使える検索テクニック ―もう日本語でググるのはやめよう
グローバル理工人材のための今日から使える検索テクニック ―もう日本語でググるのはやめよう
GroovyFX - Groove JavaFX
GroovyFX - Groove JavaFX
Alejandro Fernandez vs Luis Miguel
Alejandro Fernandez vs Luis Miguel
マイクロソフトが創る未来 医療編 20170401
マイクロソフトが創る未来 医療編 20170401
Green Behavior
Green Behavior
Elixir-Conf-Japan-2017-session-ohr486
Elixir-Conf-Japan-2017-session-ohr486
Tercera Trobada #Xatac5a Tarragona
Tercera Trobada #Xatac5a Tarragona
A deep dive into Drupal 8 routing
A deep dive into Drupal 8 routing
フェーズI/IIに置けるベイジアン・アダプティブ・メソッド
フェーズI/IIに置けるベイジアン・アダプティブ・メソッド
Marketing's important. But marketers often aren't.
Marketing's important. But marketers often aren't.
Immunisation against bacteria
Immunisation against bacteria
Mr. Nitin bassi IEWP @ 2nd India-EU Water Forum @ World Sustainable Developme...
Mr. Nitin bassi IEWP @ 2nd India-EU Water Forum @ World Sustainable Developme...
A Building Framework for the All Renewable Energy Future
A Building Framework for the All Renewable Energy Future
Wasabi waiter game - Gamification in recruitment - Manu Melwin Joy
Wasabi waiter game - Gamification in recruitment - Manu Melwin Joy
Frank Michael encore un peu plus riche
Frank Michael encore un peu plus riche
Experience WOW. A new benchmark in MDP / EDP
Experience WOW. A new benchmark in MDP / EDP
Critiques of Community Forestry
Critiques of Community Forestry
Groeispurt voor bvba kunstenaar Koen Vanmechelen
Groeispurt voor bvba kunstenaar Koen Vanmechelen
Semelhante a ARM Compute Library
ポータブルコンポーネントマネージャの実装
ポータブルコンポーネントマネージャの実装
Yosuke Matsusaka
qemu-debootstrap
qemu-debootstrap
Takatsugu Nokubi
181106 02
181106 02
openrtm
DartVM on Android
DartVM on Android
nothingcosmos
110709 3rd SyoueneIT Workshop ARMServer
110709 3rd SyoueneIT Workshop ARMServer
Kensuke SAEKI
RTミドルウェアによるロボットプログラミング技術 2.プログラミングの基礎
RTミドルウェアによるロボットプログラミング技術 2.プログラミングの基礎
Noriaki Ando
JTF2020 クロスコンパイルだけが能ではない組み込みLinuxシステムのCI/CDインフラ構築
JTF2020 クロスコンパイルだけが能ではない組み込みLinuxシステムのCI/CDインフラ構築
yaegashi
RISC-V の現況と Esperanto Technologies のアプローチ
RISC-V の現況と Esperanto Technologies のアプローチ
Yutaka Yasuda
Android が巨大すぎてお困りのあなたへ~組み込み Windows の今と、これから~
Android が巨大すぎてお困りのあなたへ~組み込み Windows の今と、これから~
Shin-ya Koga
Haswellサーベイと有限体クラスの紹介
Haswellサーベイと有限体クラスの紹介
MITSUNARI Shigeo
CMake multiplatform build-tool
CMake multiplatform build-tool
Naruto TAKAHASHI
Monomeeting 20081022
Monomeeting 20081022
Atsushi Eno
Semelhante a ARM Compute Library
(12)
ポータブルコンポーネントマネージャの実装
ポータブルコンポーネントマネージャの実装
qemu-debootstrap
qemu-debootstrap
181106 02
181106 02
DartVM on Android
DartVM on Android
110709 3rd SyoueneIT Workshop ARMServer
110709 3rd SyoueneIT Workshop ARMServer
RTミドルウェアによるロボットプログラミング技術 2.プログラミングの基礎
RTミドルウェアによるロボットプログラミング技術 2.プログラミングの基礎
JTF2020 クロスコンパイルだけが能ではない組み込みLinuxシステムのCI/CDインフラ構築
JTF2020 クロスコンパイルだけが能ではない組み込みLinuxシステムのCI/CDインフラ構築
RISC-V の現況と Esperanto Technologies のアプローチ
RISC-V の現況と Esperanto Technologies のアプローチ
Android が巨大すぎてお困りのあなたへ~組み込み Windows の今と、これから~
Android が巨大すぎてお困りのあなたへ~組み込み Windows の今と、これから~
Haswellサーベイと有限体クラスの紹介
Haswellサーベイと有限体クラスの紹介
CMake multiplatform build-tool
CMake multiplatform build-tool
Monomeeting 20081022
Monomeeting 20081022
Mais de Mr. Vengineer
XilinxのxsimでSoftware Driven Verification.pdf
XilinxのxsimでSoftware Driven Verification.pdf
Mr. Vengineer
VerilatorとSystemCでSoftware Driven Verification
VerilatorとSystemCでSoftware Driven Verification
Mr. Vengineer
VerilatorとSystemC
VerilatorとSystemC
Mr. Vengineer
TVM VTA (TSIM)
TVM VTA (TSIM)
Mr. Vengineer
Cloud TPU Driver API ソースコード解析
Cloud TPU Driver API ソースコード解析
Mr. Vengineer
Cloud Deep Learning Chips Training & Inference
Cloud Deep Learning Chips Training & Inference
Mr. Vengineer
TensorFlow Lite Delegateとは?
TensorFlow Lite Delegateとは?
Mr. Vengineer
Pixel Visual Core device driver source code analysis
Pixel Visual Core device driver source code analysis
Mr. Vengineer
Google Edge TPUで TensorFlow Liteを使った時に 何をやっているのかを妄想してみる 2 「エッジAIモダン計測制御の世界」オ...
Google Edge TPUで TensorFlow Liteを使った時に 何をやっているのかを妄想してみる 2 「エッジAIモダン計測制御の世界」オ...
Mr. Vengineer
TensorFlow XLA 「XLAとは、から、最近の利用事例について」
TensorFlow XLA 「XLAとは、から、最近の利用事例について」
Mr. Vengineer
Facebook Glow Compiler のソースコードをグダグダ語る会
Facebook Glow Compiler のソースコードをグダグダ語る会
Mr. Vengineer
Ultra96(UltraZed)実践勉強会
Ultra96(UltraZed)実践勉強会
Mr. Vengineer
Bridge TensorFlow to run on Intel nGraph backends (v0.4)
Bridge TensorFlow to run on Intel nGraph backends (v0.4)
Mr. Vengineer
Bridge TensorFlow to run on Intel nGraph backends (v0.5)
Bridge TensorFlow to run on Intel nGraph backends (v0.5)
Mr. Vengineer
TensorFlow XLA RPC
TensorFlow XLA RPC
Mr. Vengineer
TensorFlow local Python XLA client
TensorFlow local Python XLA client
Mr. Vengineer
Tiramisu をちょっと、味見してみました。
Tiramisu をちょっと、味見してみました。
Mr. Vengineer
LeFlowを調べてみました
LeFlowを調べてみました
Mr. Vengineer
Tensorflow dynamically loadable XLA plugin ソースコード解析
Tensorflow dynamically loadable XLA plugin ソースコード解析
Mr. Vengineer
Tiramisu概要
Tiramisu概要
Mr. Vengineer
Mais de Mr. Vengineer
(20)
XilinxのxsimでSoftware Driven Verification.pdf
XilinxのxsimでSoftware Driven Verification.pdf
VerilatorとSystemCでSoftware Driven Verification
VerilatorとSystemCでSoftware Driven Verification
VerilatorとSystemC
VerilatorとSystemC
TVM VTA (TSIM)
TVM VTA (TSIM)
Cloud TPU Driver API ソースコード解析
Cloud TPU Driver API ソースコード解析
Cloud Deep Learning Chips Training & Inference
Cloud Deep Learning Chips Training & Inference
TensorFlow Lite Delegateとは?
TensorFlow Lite Delegateとは?
Pixel Visual Core device driver source code analysis
Pixel Visual Core device driver source code analysis
Google Edge TPUで TensorFlow Liteを使った時に 何をやっているのかを妄想してみる 2 「エッジAIモダン計測制御の世界」オ...
Google Edge TPUで TensorFlow Liteを使った時に 何をやっているのかを妄想してみる 2 「エッジAIモダン計測制御の世界」オ...
TensorFlow XLA 「XLAとは、から、最近の利用事例について」
TensorFlow XLA 「XLAとは、から、最近の利用事例について」
Facebook Glow Compiler のソースコードをグダグダ語る会
Facebook Glow Compiler のソースコードをグダグダ語る会
Ultra96(UltraZed)実践勉強会
Ultra96(UltraZed)実践勉強会
Bridge TensorFlow to run on Intel nGraph backends (v0.4)
Bridge TensorFlow to run on Intel nGraph backends (v0.4)
Bridge TensorFlow to run on Intel nGraph backends (v0.5)
Bridge TensorFlow to run on Intel nGraph backends (v0.5)
TensorFlow XLA RPC
TensorFlow XLA RPC
TensorFlow local Python XLA client
TensorFlow local Python XLA client
Tiramisu をちょっと、味見してみました。
Tiramisu をちょっと、味見してみました。
LeFlowを調べてみました
LeFlowを調べてみました
Tensorflow dynamically loadable XLA plugin ソースコード解析
Tensorflow dynamically loadable XLA plugin ソースコード解析
Tiramisu概要
Tiramisu概要
ARM Compute Library
1.
ARM Compute Libraray https://developer.arm.com/technologies/compute-library ARMが公開した画像処理およびCNNライブラリ Linux
/ Android / Bare Metalで利用可能 2017.04.01(土) @Vengineer
2.
クロスコンパイラの用意 AArch64 : arm64-v8a gcc-linaro-5.3-2016.02-x86_64_aarch64-linux-gnu ARM
: armv7a aro/gcc-linaro-5.3-2016.02-x86_64_arm-linux-gnueabihf
3.
ビルド % scons debug=1
neon=1 opencl=0 arch=arm64-v8a Werror : Enable/disable the -Werror compilation flag (Default=1) (0|1) debug : Debug (default=0) (0|1) arch : Target Architecture (default=armv7a) (armv7a|arm64-v8a|arm64-v8.2-a|x86) os : Target OS (default=linux) (linux|android|bare_metal) build : Build type: (default=cross_compile) (native|cross_compile) opencl : Enable OpenCL support(Default=1) (0|1) neon : Enable Neon support(Default=0) (0|1)
4.
OpenCL対応 libOpenCL.so がGPU(ARM Mali)をサポートしているときのみ利用可能 この資料では、NEONのみについて説明します
5.
画像処理関連 ・Basic arithmetic, mathematical
and binary operator functions ・Colour manipulation (conversion, channel extraction, and more) ・Convolution filters (Sobel, Gaussian, and more) ・Canny Edge, Harris corners, optical flow and more ・Pyramids (such as Laplacians) ・HOG (Histogram of Oriented Gradients) ・SVM (Support Vector Machines) ・H/SGEMM (Half and Single precision General Matrix Multiply)
6.
Convolutional Neural Networks関連 ・Activation ・Convolution ・Fully
connected ・Locally connected ・Normalization ・Pooling ・Soft-max
7.
サンプルコード:scale (NEON) PPMLoader ppm;
ppmファイル Image src, dst; イメージバッファ ppm.open(argv[1]); ファイルオープン ppm.init_image(src, Format::U8); イメージ読み込み constexpr int scale_factor = 2; TensorInfo dst_tensor_info( 入力テンソル情報 src.info()->dimension(0) / scale_factor, src.info()->dimension(1) / scale_factor, Format::U8);
8.
サンプルコード:scale (NEON) dst.allocator()->init(dst_tensor_info); 初期化 NEScale
scale; スケール scale.configure(&src, &dst, コンフィギュレーション InterpolationPolicy::NEAREST_NEIGHBOR, BorderMode::UNDEFINED); src.allocator()->allocate(); メモリ割当て dst.allocator()->allocate(); メモリ割当て scale.run(); 実行
9.
サンプルコード:convolution (NEON) PPMLoader ppm;
ppmファイル Image src, tmp, dst; イメージバッファ ppm.open(argv[1]); ファイルオープン ppm.init_image(src, Format::U8); イメージ読み込み tmp.allocator()->init(*src.info()); 初期化 dst.allocator()->init(*src.info()); 初期化 NEConvolution3x3 conv3x3; 3x3 Convolution NEConvolution5x5 conv5x5; 5x5 Convolution
10.
サンプルコード:convolution (NEON) conv3x3.configure(&src, &tmp,
コンフィギュレーション gaussian3x3, 0, BorderMode::UNDEFINED); conv5x5.configure(&tmp, &dst, コンフィギュレーション gaussian5x5, 0, BorderMode::UNDEFINED); src.allocator()->allocate(); メモリ割当て tmp.allocator()->allocate(); メモリ割当て dst.allocator()->allocate(); メモリ割当て conv3x3.run(); 実行 conv5x5.run(); 実行
11.
スケジューラ arm_compute/runtime/NEON/CPPScheduler.h arm_compute/runtime/NEON/NEScheduler.h namespace arm_compute { using NEScheduler
= CPPScheduler; } NEScheduler は、CPPScheduler と同じ
12.
multithread(スレッド無し) void CPPScheduler::multithread(ICPPKernel *kernel,
const size_t split_dimension) { const Window &max_window = kernel->window(); const int num_iterations = max_window.num_iterations(split_dimension); int num_threads = std::min(num_iterations, _num_threads); if(!kernel->is_parallelisable() || 1 == num_threads) { kernel->run(max_window); } }
13.
multithread (スレッド有り) for(int t
= 0; t < num_threads; ++t) { Window win = max_window.split_window(split_dimension, t, num_threads); win.set_thread_id(t); win.set_num_threads(num_threads); if(t != num_threads - 1) { _threads[t].start(kernel, win); } else { kernel->run(win); } }
14.
サンプルカーネル:NEScaleKernel void NEScaleKernel::run(const Window
&window) { ARM_COMPUTE_ERROR_ON_UNCONFIGURED_KERNEL(this); ARM_COMPUTE_ERROR_ON_INVALID_SUBWINDOW(INEKernel::window(), window); ARM_COMPUTE_ERROR_ON(_func == nullptr); (this->*_func)(window); } _func = &NEScaleKernel::scale_nearest; _func = &NEScaleKernel::scale_bilinear; _func = &NEScaleKernel::scale_area;
15.
おしまい
Baixar agora