from nlcpy import ve_types
import nlcpy


                                                                # Cソースコード
c_src=r'''
    int ve_add(double *px, double *py, double *pz, int n) {
        #pragma omp parallel for
        for (int i = 0; i  < n; i++) pz[i] = px[i] + py[i];
        return 0;
    }
'''


                                                                # コンパイルと共有ライブラリ作成
ve_lib = nlcpy.jit.CustomVELibrary(code=c_src)


                                                                # 関数の定義
ve_add = ve_lib.get_function(
    've_add',
    args_type=(ve_types.uint64, ve_types.uint64, ve_types.uint64, ve_types.int32),
    ret_type=ve_types.int32
)


                                                                x = nlcpy.arange(10., dtype='f8')
y = nlcpy.arange(10., dtype='f8')
z = nlcpy.empty(10, dtype='f8')
# 関数呼び出し
ret = ve_add(x.ve_adr, y.ve_adr, z.ve_adr, z.size, sync=True)


                                                                print(z)

[ 0.  2.  4.  6.  8. 10. 12. 14. 16. 18.]


                                                                from nlcpy import ve_types
import nlcpy


                                                                # 別のファイルで用意したソースコードの読み込み
src = ''
with open('./ve_add.c', 'r') as fs:
    src += fs.read()
# コンパイルのためソースコードとコンパイラー指定。
ve_lib = nlcpy.jit.CustomVELibrary(
    code=src,
    ftrace=True,
    compiler='/opt/nec/ve/bin/ncc',
    dist_dir='./'
)


                                                                ve_add = ve_lib.get_function(
    've_add',
    args_type=(ve_types.uint64, ve_types.uint64, ve_types.uint64, ve_types.int32),
    ret_type=ve_types.int32
)


                                                                x = nlcpy.arange(10., dtype='f8')
y = nlcpy.arange(10., dtype='f8')
z = nlcpy.empty(10, dtype='f8')
ret = ve_add(x.ve_adr, y.ve_adr, z.ve_adr, z.size, sync=True)


                                                                print(z)

[ 0.  2.  4.  6.  8. 10. 12. 14. 16. 18.]


                                                                from nlcpy import ve_types
import nlcpy


                                                                # 別途用意した共有ライブラリを呼び出し
ve_lib = nlcpy.jit.CustomVELibrary(path='./fig4lib.so')


                                                                ve_add = ve_lib.get_function(
    've_add',
    args_type=(ve_types.uint64, ve_types.uint64, ve_types.uint64, ve_types.int32),
    ret_type=ve_types.int32
)


                                                                x = nlcpy.arange(10., dtype='f8')
y = nlcpy.arange(10., dtype='f8')
z = nlcpy.empty(10, dtype='f8')
ret = ve_add(x.ve_adr, y.ve_adr, z.ve_adr, z.size, sync=True)


                                                                print(z)

[ 0.  2.  4.  6.  8. 10. 12. 14. 16. 18.]


                                                                from nlcpy import ve_types
import nlcpy


                                                                # ２つの関数've_add'、've_mul'
c_src=r'''
    int ve_add(double *px, double *py, double *pz, int n) {
        #pragma omp parallel for
        for (int i = 0; i  < n; i++) pz[i] = px[i] + py[i];
        return 0;
    }
    int ve_mul(double *px, double *py, double *pz, int n) {
        #pragma omp parallel for
        for (int i = 0; i  < n; i++) pz[i] = px[i] * py[i];
        return 0;
    }
'''


                                                                ve_lib = nlcpy.jit.CustomVELibrary(code=c_src)


                                                                # 2つの関数の定義
ve_add = ve_lib.get_function(
    've_add',
    args_type=(ve_types.uint64, ve_types.uint64, ve_types.uint64, ve_types.int32),
    ret_type=ve_types.int32
)
ve_mul = ve_lib.get_function(
    've_mul',
    args_type=(ve_types.uint64, ve_types.uint64, ve_types.uint64, ve_types.int32),
    ret_type=ve_types.int32
)


                                                                x = nlcpy.arange(10., dtype='f8')
y = nlcpy.arange(10., dtype='f8')
z = nlcpy.empty(10, dtype='f8')
ret = ve_add(x.ve_adr, y.ve_adr, z.ve_adr, z.size, sync=True)


                                                                print(z)

[ 0.  2.  4.  6.  8. 10. 12. 14. 16. 18.]


                                                                ret = ve_mul(x.ve_adr, y.ve_adr, z.ve_adr, z.size, sync=True)


                                                                print(z)

[ 0.  1.  4.  9. 16. 25. 36. 49. 64. 81.]


                                                                from nlcpy import ve_types
import nlcpy


                                                                # Cソースコード
c_src=r'''
    int ve_add(double *px, double *py, double *pz, int n) {
        #pragma omp parallel for
        for (int i = 0; i  < n; i++) pz[i] = px[i] + py[i];
        return 0;
    }
'''


                                                                # Fortranソースコード
f_src = r"""
integer(kind=4) function ve_sub(px, py, pz, n)
    integer(kind=4), value :: n
    double precision :: px(n), py(n), pz(n)
    !$omp parallel do
    do i=1, n
        pz(i) = px(i) - py(i)
    end do
    ve_add = 0
end
"""


                                                                # Cソースコードのコンパイルと共有ライブラリ化
ve_lib = nlcpy.jit.CustomVELibrary(code=c_src, compiler='/opt/nec/ve/bin/ncc')


                                                                # 関数定義
ve_add = ve_lib.get_function(
    've_add',
    args_type=(ve_types.uint64, ve_types.uint64, ve_types.uint64, ve_types.int32),
    ret_type=ve_types.int32
)


                                                                # Fortranソースコードのコンパイルと共有ライブラリ化
ve_lib = nlcpy.jit.CustomVELibrary(code=f_src, compiler='/opt/nec/ve/bin/nfort')


                                                                # 関数定義
ve_sub = ve_lib.get_function(
    've_sub_',
    args_type=(ve_types.uint64, ve_types.uint64, ve_types.uint64, ve_types.int32),
    ret_type=ve_types.int32
)


                                                                x = nlcpy.arange(10., dtype='f8')
y = nlcpy.arange(10., dtype='f8')
z = nlcpy.empty(10, dtype='f8')
ret = ve_add(x.ve_adr, y.ve_adr, z.ve_adr, z.size, sync=True)


                                                                print(z)

[ 0.  2.  4.  6.  8. 10. 12. 14. 16. 18.]


                                                                ret = ve_sub(x.ve_adr, y.ve_adr, z.ve_adr, z.size, sync=True)
print(z)

[0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]

サイト内の現在位置

NumPy互換数値演算ライブラリNLCPy　NLCPy JITコンパイルの使い方

関連リンク

サイト内の現在位置

NumPy互換数値演算ライブラリNLCPy NLCPy JITコンパイルの使い方

関連リンク

NumPy互換数値演算ライブラリNLCPy　NLCPy JITコンパイルの使い方