Tag Archives: Microsoft

Machine Learning Tool의 종류와 용도

Machine Learning Tool의 종류는 어떤 것이 있고, 그 용도는 어떤 것으로 설계되었는지 살펴봅니다.

1. Tensorflow
Google Brain Team에서 개발했고, Neural Network 및 Machine Learning에 대한 연구에 사용되고 있습니다.
Gmail, 음성 인식, Google 포토 및 Google 검색과 같이 일상적으로 사용하는 인기있는 Google 서비스에는 Tensorflow가 탑재되어 있다고 합니다.
Tensorflow는 Data Flow Graph를 사용하여 복잡한 수치 작업을 수행하는데, 수학적 계산은 엣지와 노드가 포함된 그래프를 사용하여 정교화됩니다. 이 노드는 조작을 구현하는 데 사용되며 데이터가 공급되는 엔드 포인트로 작동 할 수도 있습니다. 엣지는 또한 다른 노드 간의 입/출력 연관을 나타냅니다.

2. Caffe
Machine Learning Framework로 CNN (Convolutional Neural Networks)을 활용하여 컴퓨터 비전/이미지 분류용으로 개발되었습니다.
텍스트, 사운드 또는 시계열 데이터가있는 응용 프로그램을 다루는 경우 Caffe는 컴퓨터 비전 이외의 용도로 사용되지 않습니다.
그러나 여러 호스트에서 동적으로 실행될 수 있으며 단일 플래그를 사용하여 CPU와 GPU간에 전환하는 작업을 잘 수행합니다.

3. Amazon Machine Learning
Amazon은 AML이라는 자체 머신러닝 서비스를 개발했습니다. AML을 사용하면 사용하기 쉬운 API를 통해 응용 프로그램에 필요한 예측을 파생시킬 수 있습니다. AML은 Amazon S3, RDS 또는 Redshift에 저장된 데이터에 연결하여 바이너리 분류, 회귀 또는 다중 클래스 분류와 같은 작업을 수행하여 새 모델을 생성 할 수 있습니다.

4. Apache Singa
Apache Singa는 주로 모델 파티셔닝을 사용하여 분산된 딥러닝과 학습 프로세스의 병렬화에 중점을 두는데 주로 이미지 인식 및 자연어 처리(NLP)를 하는데 사용됩니다.
Singa의 기술 스택은 IO, Model 및 Core라는 세가지 중요한 구성 요소로 이루어져 있는데, IO 구성 요소에는 네트워크 및 디스크에 데이터를 읽거나 쓰는 데 사용되는 클래스가 들어 있으며, Core에서는 텐서 연산과 메모리 관리 함수를 처리하고, Model은 기머신러닝 모델에 사용되는 알고리즘 및 데이터 구조를 포함합니다.

5. Microsoft CNTK
CNTK (Cognitive Toolkit)는 Microsoft의 오픈소스 Machine Learning Framework입니다. CNTK는 음성인식 영역에서 더 많이 사용되지만 텍스트 및 이미지 Training에도 사용할 수 있습니다.
AS CNN, LSTM, RNN, Sequence-to-Sequence 및 Feed Forward와 같은 다양한 머신러닝 알고리즘을 지원하며, 다양한 CPU 및 GPU를 포함한 여러 하드웨어 유형을 지원합니다.
CNTK에서 C ++ 및 Python과 같은 언어로 작업하고 내장된 교육 모델을 사용하거나 직접 빌드 할 수 있습니다.

6. Torch
2002년 NYU에서 개발된 Torch는 Twitter 및 Facebook과 같은 글로벌 서비스 업체에서 주로 쓰며, Torch는 루아(Lua)라는 언어로 코딩되어 있는 것이 특징입니다. Torch의 장점은 역시 참고문헌(?)이 많다는 것입니다.

7. Accord.NET
.NET을 기반으로하는 오픈소스 시스템 학습 Framework이며, 패턴 인식, 인공 신경망, 통계 데이터 처리, 선형 대수, 이미지 처리 등과 같은 응용 프로그램에 사용할 수있는 다양한 라이브러리로 구성됩니다.
Framework는 설치 프로그램, NuGet 패키지 및 소스 코드로 사용할 수 있는 라이브러리로 구성됩니다.
Accord.NET에는 코드 재사용과 점진적인 알고리즘 변경을 용이하게하는 매트릭스 라이브러리가 있습니다.

8. Apache Mahout
Apache Software Foundation의 무료 오픈소스 프로젝트인 Apache Mahout은 클러스터링, 분류 및 협업 필터링과 같은 애플리케이션을 위해 무료 분산 또는 확장 가능한 ML 프레임 워크를 개발하려는 목표로 구축되었습니다. Apache Mahout은 MapReduce 패러다임을 사용하여 Hadoop 위에 배포되는데, Hadoop에 저장된 Big Data 가 연결되면 Mahout은 의미있는 패턴을 찾는 데 도움을 줄 수 있습니다.

9. Theano
Theano는 2007 년 몬트리올 대학에서 개발한 것으로 저가형 머신러닝 프레임워크로 알려졌습니다.  Theano는 API 래퍼를 보낼 하이엔드 추상화 시스템을 위한 기본 플랫폼으로 주로 사용되고 있는데,  몇가지 인기있는 라이브러리의 예로는 Lasagne, Blocks 및 Keras가 있습니다. Theano를 사용하는 한가지 단점은 다중 GPU를 지원하기 위해 몇 가지 해결 방법을 모색해야한다는 것입니다.

10. Brainstorm
Python으로 작성된 Brainstorm은 여러 백엔드 시스템에서 원활하게 실행되도록 제작되었습니다. Brainstorm은 Python을 사용하여 두개의 Data API를 제공합니다. 하나는 Numpy 라이브러리의 CPU 용이고 다른 하나는 CUDA를 사용하여 GPU를 활용하는 것입니다.

중요한 문서, 사진 등 윈도우즈 파일 자동 백업 방법 – SyncToy 와 작업 스케줄러로 자동 백업 가능해

SyncToy는 마이크로소프트에서 무료로 배포하는 백업 솔루션입니다.

 

SyncToy를 이용한 자동 백업 설정 방법은 매우 간단하므로, 여기에서 설명하지는 않겠습니다.

중요한 문서, 사진 등 윈도우즈 파일 자동 백업 방법 - SyncToy 와 작업 스케줄러로 자동 백업 가능해

 

이제 작업 스케줄러에서 작업을 설정하면 되는데, 저는 아래와 같이 설정하였습니다.

중요한 문서, 사진 등 윈도우즈 파일 자동 백업 방법 - SyncToy 와 작업 스케줄러로 자동 백업 가능해

참고로 “USB”는 제가 실행하려는 작업명입니다.

다른 이름으로 설정 하셨다면, 다른 이름을 부여하셔야 합니다. 위의 예에서는 “Test Sync”가 이에 해당합니다.

중요한 문서, 사진 등 윈도우즈 파일 자동 백업 방법 - SyncToy 와 작업 스케줄러로 자동 백업 가능해

저는 밤에 컴퓨터를 많이 사용하므로 싱크 시간을 다음과 같이 설정하였습니다.

중요한 문서, 사진 등 윈도우즈 파일 자동 백업 방법 - SyncToy 와 작업 스케줄러로 자동 백업 가능해

SyncToy는 다음 URL에서 다운로드 하실 수 있습니다.

http://www.microsoft.com/downloads/details.aspx?FamilyID=c26efa36-98e0-4ee9-a7c5-98d0592d8c52&DisplayLang=en

 

 

 

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

조금 전 인텔의 클라우드 컴퓨팅 기술에 대해 잠시 리뷰를 하였습니다.

대다수의 기술 업체들이 그들의 제품에 이름을 붙이 듯 인텔에서도 이름을 붙였는데, 이를 Software-Defined Infrastructure(SDI)라고 명명했네요.

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

자세히 보면 VMWare나 Cetrix, 또는 Open Cloud Alliance 등이 하는 일들이 바로 이런 것 아닌가 싶은데요. 하여간 내용을 보면 기존에 노가다로 하던 인프라 관리를 소프트웨어적으로 스마트하게 할 수 있다는 것.

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

하지만 이를 위해서는 단순히 소프트웨어만 있어서는 불가능하겠죠.

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

현란하게 표현되어져 있지만, 결국 지가 알아서 서비스를 잘 되게 한다는 것인데요, 이로 인해 시간/비용 절약 및 효율성도 좋아진다고 주장하고 있습니다.

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

사실 이것은 아마존이나 마이크로소프트, 구글이 하고 있는 비즈니스와도 일치하는 것입니다.

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

아래의 API는 아마도 오픈스택의 영향을 받은것이 아닌가 싶은 생각이 잠깐 드네요.

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

API가 제공되면 또 다른 App 개발을 통해 개발/운영의 효율화를 꾀할 수 있다는 장점이 있을 것입니다.

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔의 강점은 서버의 핵심인 CPU를 개발한다는 것인데요. 저전력 CPU와 SSD가 만나면 이 환상궁합을 제어해 줄 소프트웨어가 필요할텐데… 이를 인텔이 제공한다면, 이 비즈니스 모델은 통할 것 같습니다.

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

인텔이 주장하는 데이터 센터 아키텍쳐의 미래는 Software-Defined Infrastructure(SDI)

제가 보기엔 이러한 아키텍쳐의 장점은 결국, 한정된 자원을 기반으로 구축된 데이터 센터에서 자원을 효율적으로 관리하게 해준다는 것이 핵심 키워드인것 같습니다. 또한 이러한 SDI가 적용되기 위한 최소한의 조건이 무엇인지 궁금하네요.

또한 이러한 비즈니스를 위해서는 파트너십이 필요할텐데요, 인텔CPU를 이용하여 서버 장비를 만드는 업체들과의 얼라이언스(Alliance)가 중요하겠다는 생각이 듭니다.

엑셀(EXCEL) 사용시 한자(중국어)를 한글로 번역하는 방법

국제화시대…. 이제 중국 문서도 볼 일이 많아졌습니다.

그런데 안타깝게도 한자가 약하네요.

 

마이크로소프트가 친절하게 저 같은 사람을 위해 번역 기능을 소프트웨어에 기본 탑재해주었다는 사실을 아시나요?

원하시는 문서를 여시고 아래의 버튼을 눌러주세요.

엑셀(EXCEL) 사용시 한자(중국어)를 한글로 번역하는 방법

그리고 원하는 단어를 아래의 칸에 복사하시고, 언어 선택하신 후 번역 요청을 하시면 친절하게 번역된 결과를 보여줍니다.

엑셀(EXCEL) 사용시 한자(중국어)를 한글로 번역하는 방법

문서를 통채로 번역해주면 참 좋을텐데, 그 정도까지의 서비스는 아직 제공하지 않네요.

이정도면 쓸만하지 않나요?

메타데이터(metadata)와 통합 콘텐츠 ID–하이퍼링크와 콘텐츠 융합을 통해 새로운 비즈니스를 창출하는 에코시스템의 핵심 컴포넌트

메타라는 말은 다른 단어들과 덧붙여 사용할 때 "among", "together", "after"라는 뜻을 가집니다.

메타와 데이터가 합쳐져서 메타데이터가 되면 "데이터와 함께 다니는"의 뜻이 됩니다.

메타데이터(metadata)와 통합 콘텐츠 ID–하이퍼링크와 콘텐츠 융합을 통해 새로운 비즈니스를 창출하는 에코시스템의 핵심 컴포넌트

즉, 실제로 저장하고자 하는 데이터(예를 들면, 비디오, 오디오, 텍스트 등)는 아니지만, 이 데이터와 직접적으로 혹은 간접적으로 연관된 정보를 제공하는 데이터를 나타내는 말인데요, 일반적으로 메타데이터를 정의할 때 가장 많이 사용되는 표현으로는 다음과 같은 것이 있습니다.

– 데이터에 대한 데이터
– 정보 자원을 설명하는 요소들의 모임
– 한 개체를 특성화하는 대리 레코드 (surrogate record)

 

메타데이터라는 말은 최근에 생성된 말이 아니며, 이미 수십 년 전부터 정보 과학(Information Science) 분야에서 다루어져 왔고, 최근에는 더욱 다양한 분야에서 사용되고 있는 용어입니다. 메타데이터의 가장 쉬운 예를 들자면, 도서관의 카드 인덱스 카탈로그를 들 수 있습니다. 도서관의 카드 인덱스 카탈로그에는 분류번호, 제목, 저자, 년도, 출판사 등 해당 도서에 대한 정보들이 수록되어 있는데 이 정보들이 바로 도서 데이터에 대한 메타데이터가 되는 것입니다. 도서 데이터와 같은 텍스트 위주의 데이터뿐만 아니라 비디오, 오디오와 같이 저장하고자 하는 데이터의 형태가 다양해짐에 따라 메타데이터도 저자나 제목과 같이 간단한 형태가 아닌 저장 포맷, 코딩 기법, 재생 시간 등과 같이 다양해지고 있습니다. 최근에는 Facebook, Twitter같은 소셜 네트워크와의 연계까지 이루어져, 메타데이터간에 상호 종속관계가 만들어지고 있습니다.

메타데이터(metadata)와 통합 콘텐츠 ID–하이퍼링크와 콘텐츠 융합을 통해 새로운 비즈니스를 창출하는 에코시스템의 핵심 컴포넌트

매일 많은 분량의 콘텐츠를 생성해내고, 다양한 정보를 확보해야 하는 방송 분야에서도 콘텐츠를 테이프나 디지털 포맷으로 저장할 때 관리의 용이성을 위해 이미 어느 정도 메타데이터를 사용하고 있습니다. 그러나 방송 프로그램을 디지털화하게 되면 같은 프로그램이라 하더라도 M-JPEG, MPEG-1, MPEG-2와 같이 압축 형식에 따른 하나 이상의 다른 미디어가 생성될 수 있고 복사로 인한 동일한 데이터가 여러 개 생성될 수 있기 때문에 이전의 데이터, 메타데이터처럼 일대일 대응 방식으로는 현 상황에 사용하기에 부적합합니다. 또한 서로 다른 메타데이터 포맷으로 인해 다른 콘텐츠 제공자의 메타데이터를 활용하여 해당 데이터를 검색하기란 매우 어렵습니다. 예를 들면, "왕건"이란 미디어가 있을 때 KBS에서는 "프로그램 제목"이라는 항목으로 저장하고, BBC에서는 미디어의 제목을 "Main Title"이라는 항목으로 저장하여 관리했다면, BBC에서 "왕건" 미디어를 KBS의 아카이브에서 검색하고자 할 때 자신의 "Main Title" 항목을 사용하여 검색하면 해당 미디어를 찾을 수 없습니다. 따라서 메타데이터의 활용도가 높아질수록 밀접하게 데이터와 메타데이터를 연결시키고, 공통의 메타데이터 집합과 표기 방식을 제정하는 것은 필수적입니다.

메타데이터(metadata)와 통합 콘텐츠 ID–하이퍼링크와 콘텐츠 융합을 통해 새로운 비즈니스를 창출하는 에코시스템의 핵심 컴포넌트

Rovi는 이러한 메타데이타를 단일화된 ID로 관리하는 솔루션을 제공합니다. 이는 구글, Apple, Microsoft와 같은 서비스업체는 물론 삼성, 파나소닉 같은 CE업체들도 사용하는 글로벌 솔루션인데, 이를 통해 서로 정보를 오픈하고, 연계하여 새로운 비즈니스를 생성하는 에코시스템의 한 축을 이루고 있습니다.

메타데이터(metadata)와 통합 콘텐츠 ID–하이퍼링크와 콘텐츠 융합을 통해 새로운 비즈니스를 창출하는 에코시스템의 핵심 컴포넌트

미국의 성공한 유명 인사들이 우리들에게 주는 교훈

미국의 성공한 기업가들 중 일부들은 학교를 중간에 중퇴하셨습니다.

 

빌 게이츠가 그러하고, 스티브 잡스가 그러합니다. 심지어 페이스북을 이끌고 있는 마크 주커버그도 그러하다고 하는데요.

미국의 성공한 유명 인사들이 우리들에게 주는 교훈

이는 좋은 학교를 나와 스팩을 쌓는 것이 능사는 아니라는 것이죠.

 

그런데 아이러니한 것은, 위에 3분 모두 학교를 안다닌게 아니라 다니다 관두었다는 것입니다.

다르게 말하자면 머리는 좋은 사람들이라는 것…