오늘도, 코드더하기

오늘도, 코드더하기

  • 분류 전체보기
    • 개발자로서 일상
    • Linux
    • DataPipeline
    • DL
    • Spark
    • kafka
    • RDBMS
    • NoSQL
    • Docker
    • Python
    • ELK Stack
    • Cloud Engineering
    • Kubernetes
    • GIT
    • ML
  • 홈
  • 태그
  • 방명록
RSS 피드
로그인
로그아웃 글쓰기 관리

오늘도, 코드더하기

컨텐츠 검색

태그

LLM RAG konlpy AI 파이썬 kafka PANDAS GPT azure Query Spark DL langchain MSSQL 카프카 GenAI Python RDBMS SQL setting

최근글

댓글

공지사항

아카이브

Apache(1)

  • Spark - Apache Spark란..

    1. Apache Spark란.. Apache Spark는 오픈소스이며, 범용적인 목적을 지닌 분산 클러스터 컴퓨팅 프레임워크으로서 Fault Tolerance & Data Parallelism을 가지고 클러스터들을 프로그래밍할 수 있게 도와준다. Apache Spark에서는 RDD, Data Frame, Data Set의 3가지 API를 제공하는데, 이러한 데이터를 바탕으로 In-memory 연산을 가능하도록 하여 디스크 기반의 Hadoop에 비해 성능을 약 100배 정도 끌어올렸다. 다만. 성능을 재대로 활용하기 위해서는 노력이 필요.. 2. Spark의 구조 스파크는 스파크를 보조하는 YARN 그리고 HDFS와 다양한 API들로 구성되어 다양한 연산처리를 할 수 있도록 구성되어 있다. 아래 그림을 ..

    2021.07.21
이전
1
다음
티스토리
© 2018 TISTORY. All rights reserved.

티스토리툴바