전체 173

UnicodeDecodeError: 'ascii' codec can't decode byte 0xHH in position Z: ordinal not in range(128) 오류원인은 번역하려는 바이트 값이 128~255 라서이다.

ASCII는, HEX 0x00 ~ 0x7F (== DEC 0 ~ 127) 범위에서만 정의되었다. 그런데 바이트 0x80~0xFF (== DEC 128 ~ 255)를 코덱에 따라 번역하라고 하니, 오류가 나는 것이다. 이 오류가 뜨면, 다른 코덱 쓰면 해결된다. 한국어면 utf-8, cp949, utf-16 순으로 해보고, 영어권이면 적절한 다른 코덱들 쓰면 된다. 오류나는 바이트 값들은 접은글에 넣어뒀다. 더보기 0x80 0x81 0x82 0x83 0x84 0x85 0x86 0x87 0x88 0x89 0x8A 0x8B 0x8C 0x8D 0x8E 0x8F 0x90 0x91 0x92 0x93 0x94 0x95 0x96 0x97 0x98 0x99 0x9A 0x9B 0x9C 0x9D 0x9E 0x9F 0xA0 ..

한국어 인코딩 과정에서 나오는 주요 Unicode Decode Error 목록

내가 이 문제로 골머리를 좀 앓는다. 나 포함 Unicode Decode Error 와 다투는 많은 이들을 위해 도움이 되었으면 좋겠다. 1. 들어가기에 앞서, position number를 이해한다. byte_data = b'\x00\x01\x02\x03\x04 ... \0xFF' 라는 예시를 들겠다. 인코딩 오류를 볼때 아래의 개념을 쓴다. in position 0 == 0번째 위치 == 바이트값 \x00 in position 1 == 1번째 위치 == 바이트값 \x01 in position 2 == 2번째 위치 == 바이트값 \x01 in position 255 == 255번째 위치 == 바이트값 \xFF 실제 텍스트 데이터는 이보다 복잡하게 나올 것이다만. 바이트, 인코딩, 유니코드 사이의 관계 ..

자바(JAVA)에서 <<< 가 없는 이유: <<랑 기능이 같아서이다.

자바에는 > 와 >>>의 3가지 shift 연산자가 있다.부등호 개수명칭 2arithmetic(signed) L/R shift산술 시프트MSB를 제외한 나머지만 시프트3logical(unsigned) R shift논리 시프트MSB까지도 같이 시프트 보통 대응하는 개념이 존재하는데 어째서 이유는   출처https://stackoverflow.com/questions/15318617/why-java-doesnt-support-operatorhttps://stackoverflow.com/questions/26151644/why-is-there-no-unsigned-left-shift-operator-in-java

파이썬 절대 주소값(absolute address) 받아오는 3가지 방법

가끔 그냥 주소를 입력하면 잘 안된다. 이유는 unicode escape 로 인식되는 일부 백슬래쉬+영문자 기호. 그래서 보정해 주어야 한다. 보정할 때 가장 권장하는 방식은 정슬래쉬/ 로 쓰기다. 유닉스나 리눅스 등에서도 호환되는 방법이기 때문. ## 문제: 역슬래시(backslash) 1개로만 된 주소를 바로 넣었다가는, unicode-escape 와 혼동하여 오류날 때가 많다. a = "D:\test\Uopenthis.txt" >>> ''' Input In [0] a = "D:\test\Uopenthis.txt" ^ SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 7-8: truncated \UXXXX..

오토핫키) 편리하게 구글링 하는 단축키 만들기

아래의 코드를 기존의 오토핫키 스크립트에 집어넣는다. 원래 방법 드래그 복사(Ctrl+C 나 우클릭 후 복사). 운좋게 크롬 창에서 복사하는 것이면 우클릭 후 구글검색 크롬 창 띄우기 검색에 붙여넣고 엔터 오토핫키 설정하고 나서, 검색할 내용 드래그하고, 단축키를 누르면 바로 웹브라우저 띄워서 해당내용을 구글검색해서 보여준다. #j::#f ; 기존의 피드백 센터를 Win & j 로 옮긴다. #f:: ; 드래그하고 Win & f 를 누르면, 드래그한 부분을 복사하여 구글에 검색시킨다. { Clipboard = Send, ^c clipwait Run, https://www.google.com/search?q=%clipboard% Return } /* #f 잘 안먹힐 수도 있다. 그러면 LWin & f 등 같..

판다스 데이터프레임 행을 한번에 모두 보기: 어쩌다 한번만, 또는 항상

ipynb로 셀 실행해서 판다스 데이터프레임을 불러오면, 행이 적은 것은 한번에 다 보여주는데, 대체로 max_rows 기본값인 60줄을 넘어가면 콘솔 출력창에서 양끝만 5줄 정도씩 보여주고 가운데는 생략해 버린다. 그걸 강제로 전부 보여달라고 요청하는 코드이다. 주로 알려주던 방법은, 보여주는 개수의 기본값을 변경하는 방법이라 매번 바꾸어주어야 하는데 되게 불편하다. 어쩌다 한두번 길게 봐야 하면 아래의 코드를 실행하는 것이 가장 적당하다. 아래 코드에서 필요한 만큼 갖다쓴다. 일반적으로는 None 쓰는 것이 제일 편리하다. 언제나 최대 개수를 보여달라는 뜻이다. import pandas as pd foo = pd.DataFrame(foo_path) with pd.option_context( 'disp..

You can replace slanted parallel symbol as unicode ⫽ (U+2AFD, Double Solidus Operator)

I had to insert parallel symbol with using MathJax. Official unicode symbol of the "parallel" and "not parallel" signs have codepoints U+2225 (∥) and U+2226 (∦) However, what I had to make was a slanted parallel symbol, similar as // (two slashes). existing solutions offer using some special packages, but I cannot use any special package in my work. I tried to find another unicode symbol as simi..

MathJax 2023.09.15

Mathjax 에 제3자 추가 확장 패키지(third party extensions) 넣기: 문법 넣는 방법 예제도 포함

Mathjax 기본 패키지 말고, 다른 패키지들이 필요해서 넣는답시고 반나절을 헤맸다. 특히 \underbracket 문법을 지원하는 mathtools가 필요했다. 적절한 구문은 아래와 같다. HTML의 헤드 부분에 집어넣어준다. 필요하면 다른 수식설정을 script로 더 집어넣어 준다. 출처와 찾은 방법 구글에 각종 찾아줘요 구문을 넣었으나 실패. 아래는 그 키워드 how to ; import ; third party ; extra ; package ; extension ; mathjax ; HTML ; Latex 그러다가 아예 스택오버플로우에서만 검색해 보았다. extension ; mathjax ; HTML https://stackoverflow.com/search?q=mathjax+extensio..

MathJax 2023.09.15