토큰 (Token)

항목	세부 사양	비고
카테고리	AI 및 데이터 처리 기술 (AI & Translation Technology)	소프트웨어 논리 단위
스티치 분류 참조	ISO 4915 (301, 401, 504, 602 등)	데이터 내 식별 대상 규격
데이터 처리 엔진	GPT-4o, Claude 3.5, Llama 3.1, Gemini 1.5 Pro	주요 LLM 모델
토큰화 알고리즘	BPE (Byte-Pair Encoding), WordPiece, SentencePiece	모델별 상이
처리 속도 (TPS)	30 ~ 150 Tokens Per Second	서버 사양 및 모델 규모에 의존
컨텍스트 창	8K ~ 128K+ Tokens (최대 2M 지원 모델 존재)	한 번에 처리 가능한 문서 분량
주요 적용 데이터	Tech Pack, BOM, Sewing Spec, QC Manual	봉제 현장 기술 문서
인식 대상 하드웨어	Juki DDL-9000C, Brother S-7300A, Yamato VG 등	데이터 내 엔티티 식별 대상
바늘/기계 매칭	DB×1, DP×5, DC×27, UY 128 GAS 등	전문 용어 보호 설정 필수
비용 단위	1M Tokens 당 $0.15 ~ $15.00 (모델별 차등)	API 호출 비용 기준
임베딩 차원	768, 1536, 3072 Dimensions	데이터 벡터화 정밀도
권장 장력 데이터	Towa Gauge 기준 20-35gf (본봉 밑실)	토큰 내 수치 무결성 검증 기준
권장 재봉 속도	Max 5,000 spm (Juki DDL-9000C 기준)	기술 문서 내 수치 데이터 예시

언어	용어	의미 및 비고
한국어	토큰값	AI 서비스 이용료 또는 데이터 처리 비용을 의미함.
한국어	짤림 (Jjal-rim)	토큰 제한으로 인해 작업지시서 문장이 끝까지 출력되지 않은 상태.
한국어	도사 (Dosa)	AI가 생성한 토큰 결과물을 최종 검수하고 기술적 오류를 바로잡는 숙련된 기술 편집자.
베트남어	Lỗi mã hóa	인코딩 오류로 인해 텍스트가 깨져서 들어오는 현상.
베트남어	Dịch sai	토큰 매핑 오류로 인한 기술 용어 오역.
일본어	テキスト切れ	데이터 전송 중 문구가 단절되어 공정 설명이 불완전한 상태.
중국어	令牌 (Língpái)	토큰의 직역 표현이나, 현장에서는 주로 데이터 인증 키와 혼용됨.
중국어	数据溢出	데이터 오버플로우로 인해 토큰 처리가 중단된 상태.
인도네시아어	Salah Terjemah	기술적 맥락을 무시한 토큰 번역 오류.
한국어	이세 (Ise)	Ease Amount. 토큰화 시 '이세'와 '이세(2세)'를 구분하는 맥락 파악이 중요함.
베트남어	Vắt sổ	오바로크(Overlock). AI가 'Overlock' 토큰을 이 용어로 정확히 매핑해야 함.

¶ 개요