coderIML
diff --git a/‎src/NativeProviders/CUDA/blas.cpp
Lines changed: 55 additions & 83 deletions b/‎src/NativeProviders/CUDA/blas.cpp
Lines changed: 55 additions & 83 deletions
diff --git a/‎src/NativeProviders/CUDA/capabilities.cpp
Lines changed: 17 additions & 9 deletions b/‎src/NativeProviders/CUDA/capabilities.cpp
Lines changed: 17 additions & 9 deletions
diff --git a/‎src/NativeProviders/CUDA/wrapper_cuda.h
Lines changed: 2 additions & 1 deletion b/‎src/NativeProviders/CUDA/wrapper_cuda.h
Lines changed: 2 additions & 1 deletion
diff --git a/‎src/Numerics/Control.cs
Lines changed: 4 additions & 0 deletions b/‎src/Numerics/Control.cs
Lines changed: 4 additions & 0 deletions
@@ -4,201 +4,173 @@
 #include "wrapper_cuda.h"
 
 template<typename T, typename AXPY>
-void cuda_axpy(const cublasHandle_t blasHandle, const int n, const T alpha, const T x[], int incX, T y[], int incY, AXPY axpy, cudaError_t *error, cublasStatus_t *blasStatus)
+CudaResults cuda_axpy(const cublasHandle_t blasHandle, const int n, const T alpha, const T x[], int incX, T y[], int incY, AXPY axpy)
 {
 	T *d_X = NULL;
 	T *d_Y = NULL;
-	*error = cudaError_t::cudaSuccess;
-	*blasStatus = cublasStatus_t::CUBLAS_STATUS_SUCCESS;
+	CudaResults results;
 
-	SAFECUDACALL(error, cudaMalloc((void**)&d_X, n*sizeof(T)))
-	SAFECUDACALL(error, cudaMalloc((void**)&d_Y, n*sizeof(T)))
+	SAFECUDACALL(results.error, cudaMalloc((void**)&d_X, n*sizeof(T)));
+	SAFECUDACALL(results.error, cudaMalloc((void**)&d_Y, n*sizeof(T)));
 
-	SAFECUDACALL(blasStatus, cublasSetVector(n, sizeof(T), x, incX, d_X, incX))
-	SAFECUDACALL(blasStatus, cublasSetVector(n, sizeof(T), y, incY, d_Y, incY))
+	SAFECUDACALL(results.blasStatus, cublasSetVector(n, sizeof(T), x, incX, d_X, incX));
+	SAFECUDACALL(results.blasStatus, cublasSetVector(n, sizeof(T), y, incY, d_Y, incY));
 
-	SAFECUDACALL(blasStatus, axpy(blasHandle, n, &alpha, d_X, incX, d_Y, incX))
+	SAFECUDACALL(results.blasStatus, axpy(blasHandle, n, &alpha, d_X, incX, d_Y, incX));
 
-	SAFECUDACALL(blasStatus, cublasGetVector(n, sizeof(T), d_Y, incY, y, incY))
+	SAFECUDACALL(results.blasStatus, cublasGetVector(n, sizeof(T), d_Y, incY, y, incY));
 
 exit:
 	cudaFree(d_X);
 	cudaFree(d_Y);
+
+	return results;
 }
 
 template<typename T, typename SCAL>
-void cuda_scal(const cublasHandle_t blasHandle, const int n, const T alpha, T x[], int incX, SCAL scal, cudaError_t *error, cublasStatus_t *blasStatus)
+CudaResults cuda_scal(const cublasHandle_t blasHandle, const int n, const T alpha, T x[], int incX, SCAL scal)
 {
 	T *d_X = NULL;
-	*error = cudaError_t::cudaSuccess;
-	*blasStatus = cublasStatus_t::CUBLAS_STATUS_SUCCESS;
+	CudaResults results;
 
-	SAFECUDACALL(error, cudaMalloc((void**)&d_X, n*sizeof(T)))
-	SAFECUDACALL(blasStatus, cublasSetVector(n, sizeof(T), x, incX, d_X, incX))
-	SAFECUDACALL(blasStatus, scal(blasHandle, n, &alpha, d_X, incX))
-	SAFECUDACALL(blasStatus, cublasGetVector(n, sizeof(T), d_X, incX, x, incX))
+	SAFECUDACALL(results.error, cudaMalloc((void**)&d_X, n*sizeof(T)));
+	SAFECUDACALL(results.blasStatus, cublasSetVector(n, sizeof(T), x, incX, d_X, incX));
+	SAFECUDACALL(results.blasStatus, scal(blasHandle, n, &alpha, d_X, incX));
+	SAFECUDACALL(results.blasStatus, cublasGetVector(n, sizeof(T), d_X, incX, x, incX));
 
 exit:
 	cudaFree(d_X);
+
+	return results;
 }
 
 template<typename T, typename DOT>
-void cuda_dot(const cublasHandle_t blasHandle, const int n, const T x[], int incX, const T y[], int incY, T* result, DOT dot, cudaError_t *error, cublasStatus_t *blasStatus)
+CudaResults cuda_dot(const cublasHandle_t blasHandle, const int n, const T x[], int incX, const T y[], int incY, T* result, DOT dot)
 {
 	T *d_X = NULL;
 	T *d_Y = NULL;
-	*error = cudaError_t::cudaSuccess;
-	*blasStatus = cublasStatus_t::CUBLAS_STATUS_SUCCESS;
+	CudaResults results;
 
-	SAFECUDACALL(error, cudaMalloc((void**)&d_X, n*sizeof(T)))
-	SAFECUDACALL(error, cudaMalloc((void**)&d_Y, n*sizeof(T)))
+	SAFECUDACALL(results.error, cudaMalloc((void**)&d_X, n*sizeof(T)));
+	SAFECUDACALL(results.error, cudaMalloc((void**)&d_Y, n*sizeof(T)));
 
-	SAFECUDACALL(blasStatus, cublasSetVector(n, sizeof(T), x, incX, d_X, incX))
-	SAFECUDACALL(blasStatus, cublasSetVector(n, sizeof(T), y, incY, d_Y, incY))
+	SAFECUDACALL(results.blasStatus, cublasSetVector(n, sizeof(T), x, incX, d_X, incX));
+	SAFECUDACALL(results.blasStatus, cublasSetVector(n, sizeof(T), y, incY, d_Y, incY));
 
-	SAFECUDACALL(blasStatus, dot(blasHandle, n, d_X, incX, d_Y, incY, result))
+	SAFECUDACALL(results.blasStatus, dot(blasHandle, n, d_X, incX, d_Y, incY, result));
 
 exit:
 	cudaFree(d_X);
 	cudaFree(d_Y);
+
+	return results;
 }
 
 template<typename T, typename GEMM>
-void cuda_gemm(const cublasHandle_t handle, const cublasOperation_t transa, const cublasOperation_t transb, int m, int n, int k, const T alpha, const T A[], int lda, const T B[], int ldb, const T beta, T C[], int ldc, GEMM gemm, cudaError_t *error, cublasStatus_t *blasStatus)
+CudaResults cuda_gemm(const cublasHandle_t handle, const cublasOperation_t transa, const cublasOperation_t transb, int m, int n, int k, const T alpha, const T A[], int lda, const T B[], int ldb, const T beta, T C[], int ldc, GEMM gemm)
 {
 	T *d_A = NULL;
 	T *d_B = NULL;
 	T *d_C = NULL;
-	*error = cudaError_t::cudaSuccess;
-	*blasStatus = cublasStatus_t::CUBLAS_STATUS_SUCCESS;
+	CudaResults results;
 
-	SAFECUDACALL(error, cudaMalloc((void**)&d_A, m*k*sizeof(T)))
-	SAFECUDACALL(blasStatus, cublasSetMatrix(m, k, sizeof(T), A, m, d_A, m))
+	SAFECUDACALL(results.error, cudaMalloc((void**)&d_A, m*k*sizeof(T)));
+	SAFECUDACALL(results.blasStatus, cublasSetMatrix(m, k, sizeof(T), A, m, d_A, m));
 
-	SAFECUDACALL(error, cudaMalloc((void**)&d_B, k*n*sizeof(T)))
-	SAFECUDACALL(blasStatus, cublasSetMatrix(k, n, sizeof(T), B, k, d_B, k))
+	SAFECUDACALL(results.error, cudaMalloc((void**)&d_B, k*n*sizeof(T)));
+	SAFECUDACALL(results.blasStatus, cublasSetMatrix(k, n, sizeof(T), B, k, d_B, k));
 
-	SAFECUDACALL(error, cudaMalloc((void**)&d_C, m*n*sizeof(T)))
-	SAFECUDACALL(blasStatus, cublasSetMatrix(m, n, sizeof(T), C, m, d_C, m))
+	SAFECUDACALL(results.error, cudaMalloc((void**)&d_C, m*n*sizeof(T)));
+	SAFECUDACALL(results.blasStatus, cublasSetMatrix(m, n, sizeof(T), C, m, d_C, m));
 
-	SAFECUDACALL(blasStatus, gemm(handle, transa, transb, m, n, k, &alpha, d_A, lda, d_B, ldb, &beta, d_C, ldc))
+	SAFECUDACALL(results.blasStatus, gemm(handle, transa, transb, m, n, k, &alpha, d_A, lda, d_B, ldb, &beta, d_C, ldc));
 
-	SAFECUDACALL(blasStatus, cublasGetMatrix(m, n, sizeof(T), d_C, m, C, m))
+	SAFECUDACALL(results.blasStatus, cublasGetMatrix(m, n, sizeof(T), d_C, m, C, m));
 
 exit:
 	cudaFree(d_A);
 	cudaFree(d_B);
 	cudaFree(d_C);
+
+	return results;
 }
 
 extern "C" {
 
 	DLLEXPORT CudaResults s_axpy(const cublasHandle_t blasHandle, const int n, const float alpha, const float x[], float y[]){
-		CudaResults ret;
-		cuda_axpy(blasHandle, n, alpha, x, 1, y, 1, cublasSaxpy, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_axpy(blasHandle, n, alpha, x, 1, y, 1, cublasSaxpy);
 	}
 
 	DLLEXPORT CudaResults d_axpy(const cublasHandle_t blasHandle, const int n, const double alpha, const double x[], double y[]){
-		CudaResults ret;
-		cuda_axpy(blasHandle, n, alpha, x, 1, y, 1, cublasDaxpy, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_axpy(blasHandle, n, alpha, x, 1, y, 1, cublasDaxpy);
 	}
 
 	DLLEXPORT CudaResults c_axpy(const cublasHandle_t blasHandle, const int n, const cuComplex alpha, const cuComplex x[], cuComplex y[]){
-		CudaResults ret;
-		cuda_axpy(blasHandle, n, alpha, x, 1, y, 1, cublasCaxpy, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_axpy(blasHandle, n, alpha, x, 1, y, 1, cublasCaxpy);
 	}
 
 	DLLEXPORT CudaResults z_axpy(const cublasHandle_t blasHandle, const int n, const cuDoubleComplex alpha, const cuDoubleComplex x[], cuDoubleComplex y[]){
-		CudaResults ret;
-		cuda_axpy(blasHandle, n, alpha, x, 1, y, 1, cublasZaxpy, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_axpy(blasHandle, n, alpha, x, 1, y, 1, cublasZaxpy);
 	}
 
 	DLLEXPORT CudaResults s_scale(const cublasHandle_t blasHandle, const int n, const float alpha, float x[]){
-		CudaResults ret;
-		cuda_scal(blasHandle, n, alpha, x, 1, cublasSscal, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_scal(blasHandle, n, alpha, x, 1, cublasSscal);
 	}
 
 	DLLEXPORT CudaResults d_scale(const cublasHandle_t blasHandle, const int n, const double alpha, double x[]){
-		CudaResults ret;
-		cuda_scal(blasHandle, n, alpha, x, 1, cublasDscal, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_scal(blasHandle, n, alpha, x, 1, cublasDscal);
 	}
 
 	DLLEXPORT CudaResults c_scale(const cublasHandle_t blasHandle, const int n, const cuComplex alpha, cuComplex x[]){
-		CudaResults ret;
-		cuda_scal(blasHandle, n, alpha, x, 1, cublasCscal, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_scal(blasHandle, n, alpha, x, 1, cublasCscal);
 	}
 
 	DLLEXPORT CudaResults z_scale(const cublasHandle_t blasHandle, const int n, const cuDoubleComplex alpha, cuDoubleComplex x[]){
-		CudaResults ret;
-		cuda_scal(blasHandle, n, alpha, x, 1, cublasZscal, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_scal(blasHandle, n, alpha, x, 1, cublasZscal);
 	}
 
 	DLLEXPORT CudaResults s_dot_product(const cublasHandle_t blasHandle, const int n, const float x[], const float y[], float *result){
-		CudaResults ret;
-		cuda_dot(blasHandle, n, x, 1, y, 1, result, cublasSdot, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_dot(blasHandle, n, x, 1, y, 1, result, cublasSdot);
 	}
 
 	DLLEXPORT CudaResults d_dot_product(const cublasHandle_t blasHandle, const int n, const double x[], const double y[], double *result){
-		CudaResults ret;
-		cuda_dot(blasHandle, n, x, 1, y, 1, result, cublasDdot, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_dot(blasHandle, n, x, 1, y, 1, result, cublasDdot);
 	}
 
 	DLLEXPORT CudaResults c_dot_product(const cublasHandle_t blasHandle, const int n, const cuComplex x[], const cuComplex y[], cuComplex *result){
-		CudaResults ret;
-		cuda_dot(blasHandle, n, x, 1, y, 1, result, cublasCdotu, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_dot(blasHandle, n, x, 1, y, 1, result, cublasCdotu);
 	}
 
 	DLLEXPORT CudaResults z_dot_product(const cublasHandle_t blasHandle, const int n, const cuDoubleComplex x[], const cuDoubleComplex y[], cuDoubleComplex *result){
-		CudaResults ret;
-		cuda_dot(blasHandle, n, x, 1, y, 1, result, cublasZdotu, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_dot(blasHandle, n, x, 1, y, 1, result, cublasZdotu);
 	}
 
 	DLLEXPORT CudaResults s_matrix_multiply(const cublasHandle_t blasHandle, cublasOperation_t transA, cublasOperation_t transB, const int m, const int n, const int k, const float alpha, const float x[], const float y[], const float beta, float c[]){
-		CudaResults ret;
 		int lda = transA == CUBLAS_OP_N ? m : k;
 		int ldb = transB == CUBLAS_OP_N ? k : n;
 
-		cuda_gemm(blasHandle, transA, transB, m, n, k, alpha, x, lda, y, ldb, beta, c, m, cublasSgemm, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_gemm(blasHandle, transA, transB, m, n, k, alpha, x, lda, y, ldb, beta, c, m, cublasSgemm);
 	}
 
 	DLLEXPORT CudaResults d_matrix_multiply(const cublasHandle_t blasHandle, cublasOperation_t transA, cublasOperation_t transB, const int m, const int n, const int k, const double alpha, const double x[], const double y[], const double beta, double c[]){
-		CudaResults ret;
 		int lda = transA == CUBLAS_OP_N ? m : k;
 		int ldb = transB == CUBLAS_OP_N ? k : n;
 
-		cuda_gemm(blasHandle, transA, transB, m, n, k, alpha, x, lda, y, ldb, beta, c, m, cublasDgemm, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_gemm(blasHandle, transA, transB, m, n, k, alpha, x, lda, y, ldb, beta, c, m, cublasDgemm);
 	}
 
 	DLLEXPORT CudaResults c_matrix_multiply(const cublasHandle_t blasHandle, cublasOperation_t transA, cublasOperation_t transB, const int m, const int n, const int k, const cuComplex alpha, const cuComplex x[], const cuComplex y[], const cuComplex beta, cuComplex c[]){
-		CudaResults ret;
 		int lda = transA == CUBLAS_OP_N ? m : k;
 		int ldb = transB == CUBLAS_OP_N ? k : n;
 
-		cuda_gemm(blasHandle, transA, transB, m, n, k, alpha, x, lda, y, ldb, beta, c, m, cublasCgemm, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_gemm(blasHandle, transA, transB, m, n, k, alpha, x, lda, y, ldb, beta, c, m, cublasCgemm);
 	}
 
 	DLLEXPORT CudaResults z_matrix_multiply(const cublasHandle_t blasHandle, cublasOperation_t transA, cublasOperation_t transB, const int m, const int n, const int k, const cuDoubleComplex alpha, const cuDoubleComplex x[], const cuDoubleComplex y[], const cuDoubleComplex beta, cuDoubleComplex c[]){
-		CudaResults ret;
 		int lda = transA == CUBLAS_OP_N ? m : k;
 		int ldb = transB == CUBLAS_OP_N ? k : n;
 
-		cuda_gemm(blasHandle, transA, transB, m, n, k, alpha, x, lda, y, ldb, beta, c, m, cublasZgemm, &ret.error, &ret.blasStatus);
-		return ret;
+		return cuda_gemm(blasHandle, transA, transB, m, n, k, alpha, x, lda, y, ldb, beta, c, m, cublasZgemm);
 	}
 
 }
 
@@ -1,4 +1,4 @@
-#include "wrapper_common.h"
+#include "wrapper_cuda.h"
 #include "cuda_runtime.h"
 #include "cublas_v2.h"
 #include "cusolverDn.h"
@@ -79,20 +79,28 @@ extern "C" {
 		}
 	}
 
-	DLLEXPORT cublasStatus_t createBLASHandle(cublasHandle_t *blasHandle){
-		return cublasCreate(blasHandle);
+	DLLEXPORT CudaResults createBLASHandle(cublasHandle_t *blasHandle){
+		CudaResults ret;
+		ret.blasStatus = cublasCreate(blasHandle);
+		return ret;
 	}
 
-	DLLEXPORT cublasStatus_t destroyBLASHandle(cublasHandle_t blasHandle){
-		return cublasDestroy(blasHandle);
+	DLLEXPORT CudaResults destroyBLASHandle(cublasHandle_t blasHandle){
+		CudaResults ret;
+		ret.blasStatus = cublasDestroy(blasHandle);
+		return ret;
 	}
 
-	DLLEXPORT cusolverStatus_t createSolverHandle(cusolverDnHandle_t *solverHandle){
-		return cusolverDnCreate(solverHandle);
+	DLLEXPORT CudaResults createSolverHandle(cusolverDnHandle_t *solverHandle){
+		CudaResults ret;
+		ret.solverStatus = cusolverDnCreate(solverHandle);
+		return ret;
 	}
 
-	DLLEXPORT cusolverStatus_t destroySolverHandle(cusolverDnHandle_t solverHandle){
-		return cusolverDnDestroy(solverHandle);
+	DLLEXPORT CudaResults destroySolverHandle(cusolverDnHandle_t solverHandle){
+		CudaResults ret;
+		ret.solverStatus = cusolverDnDestroy(solverHandle);
+		return ret;
 	}
 
 #ifdef __cplusplus
 
@@ -3,9 +3,10 @@
 
 #include "wrapper_common.h"
 #include "cuda_runtime.h"
+#include "cublas_v2.h"
 #include "cusolver_common.h"
 
-#define SAFECUDACALL(error,call) {*error = call; if(*error){goto exit;}}
+#define SAFECUDACALL(error,call) {error = call; if(error){goto exit;}}
 
 typedef struct
 {
 
@@ -261,6 +261,10 @@ public static ILinearAlgebraProvider LinearAlgebraProvider
             {
                 value.InitializeVerify();
 
+                // dispose the previous value if necessary
+                if (_linearAlgebraProvider != null && _linearAlgebraProvider is IDisposable)
+                    (_linearAlgebraProvider as IDisposable).Dispose();
+
                 // only actually set if verification did not throw
                 _linearAlgebraProvider = value;
             }
Original file line number	Diff line number	Diff line change
`@@ -3,9 +3,10 @@`
`3`	`3`
`4`	`4`	`#include "wrapper_common.h"`
`5`	`5`	`#include "cuda_runtime.h"`
	`6`	`+#include "cublas_v2.h"`
`6`	`7`	`#include "cusolver_common.h"`
`7`	`8`
`8`		`-#define SAFECUDACALL(error,call) {error = call; if(error){goto exit;}}`
	`9`	`+#define SAFECUDACALL(error,call) {error = call; if(error){goto exit;}}`
`9`	`10`
`10`	`11`	`typedef struct`
`11`	`12`	`{`
Original file line number	Diff line number	Diff line change
`@@ -261,6 +261,10 @@ public static ILinearAlgebraProvider LinearAlgebraProvider`
`261`	`261`	`{`
`262`	`262`	`value.InitializeVerify();`
`263`	`263`
	`264`	`+ // dispose the previous value if necessary`
	`265`	`+ if (_linearAlgebraProvider != null && _linearAlgebraProvider is IDisposable)`
	`266`	`+ (_linearAlgebraProvider as IDisposable).Dispose();`
	`267`	`+`
`264`	`268`	`// only actually set if verification did not throw`
`265`	`269`	`_linearAlgebraProvider = value;`
`266`	`270`	`}`