bandi2716's picture
Upload folder using huggingface_hub
fb6409a verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:17552
  - loss:MultipleNegativesRankingLoss
base_model: bandi2716/klue-roberta-base-klue-sts
widget:
  - source_sentence: 미국에서  번째로 많은 유학생 국적은?
    sentences:
      - >-
        박근혜 대통령이 17일 포항제철소 내 파이넥스 3공장을 찾은 것은 세계 제철 기술을 선도하는 핵심 사업이라는 점을 평가한 것이라고
        포스코 측은 설명했다.파이넥스 3공장은 지난 1월 가동을 시작했다. 하루 5700, 연 200만의 쇳물을 뽑아내고 있다. 포스코
        관계자는 “이곳에서 생산한 쇳물은 모두 제강공장에서 사용된다”며 “기존의 고로에서 나온 쇳물과 품질에 전혀 차이가 없다”고
        설명했다. 포스코는 1992년 파이넥스 공법 기술 개발에 착수해 11년 만인 2003년 연 60만 규모의 1공장 가동을
        시작했다.포스코 관계자는 “다른 철강업체들도 파이넥스와 같은 용선기술 개발에 나섰지만 모두 실패했다”며 “이에 해외 업체들로부터
        기술수출 요청이 이어지고 있다”고 설명했다. 실제로 3공장 가동으로 유휴설비가 된 1공장 설비는 인도의 메스코스틸이 관심을 보여
        지난 8월 설비 매각에 관한 양해각서(MOU)를 체결했다. 중국 충칭강철과 함께 추진 중인 연산 300만t 규모의 충칭 파이넥스
        공장도 내년 중 첫 삽을 뜰 예정이다.포스코는 파이넥스 공법이 기존 고로 방식보다 생산비용이 저렴하고 환경친화적인 만큼 해외
        수출이 확대될 것으로 기대하고 있다. 파이넥스는 고로 방식에 비해 황산화물(SOx)과 질소산화물(NOx) 배출량이 각각 60%,
        85% 정도 적다. 회사 관계자는 “공장 설비의 85%를 국내 37개 중소기업에서 제작하기 때문에 해외에 수출하면 중소기업
        동반성장 효과를 기대할 수 있다”고 강조했다.
      - >-
        한국 사람들은 종종 양 극단을 오간다. 교회에 나가면서 점을 보는가 하면, 절에 다니면서 정화수를 떠놓고 민간신앙을 지킨다.
        산신에 치성을 드리면서 유교적인 제사를 지내기도 한다. 한옥에는 남방문화의 상징인 대청마루와 북방에서 유래한 온돌을 함께
        만들었다. 한(恨)으로 진 응어리를 흥(興)으로 풀어낸다. 《극단의 한국인, 극단의 창조성》은 ‘극단’이란 열쇳말로 한국인의
        기질을 분석한 책이다. 저자는 극단을 포용하는 한국인의 특징을 네 가지로 분류한다. 한국인은 극단과 극단을 수용하고, 극단을
        넘나들고, 극단의 중간지대를 만들어 충돌을 피하고, 부분을 깨부수어서 더 큰 통합을 만들어낸다는 것이다. 저자는 “한국인은 서로
        대척점에 있는 것들을 끌어안고, 나아가 여러 가지를 용광로에 넣고 융복합해서 새로운 것을 뽑아낸다”며 “이것이 한민족이 발전할
        수밖에 없는 이유”라고 말한다.한국인은 ‘빨리빨리’를 ‘은근과 끈기’ 있게 하는 민족이다. 저자는 “어느 민족이 빨리빨리 하면서
        완성도를 높일 수 있느냐”며 “억척스럽게 놀고 억척스럽게 일하는 사람들이 한국인”이라고 말한다. 동시에 “조선시대 궁에서는
        500년을 하루도 빠짐없이 왕의 일거수일투족을 기록했고 백성들은 매일 논으로 나가 농사짓는 고역을 감당했다”며 “한국인은 하나를
        시작하면 지치지 않고 오랜 기간 지속하는 끈기가 있는 사람들”이라고 분석한다. 서로 상충돼 보이는 두 가지 기질이 공존하는
        것이다.저자는 우리말에도 극단을 포용하는 문화가 반영됐다고 본다. 나들이, 빼닫이, 여닫이 등 반대되는 요소를 하나로 묶은 단어가
        수없이 많다는 게 저자의 설명이다. 한국의 음식 문화도 양 극단을 넘나든다. 정착의 산물인 발효식품이 유난히 발달한 한편 겉절이,
        상추쌈 같은 자연 상태의 음식을 그대로 즐기기도 한다. 오래 끓이는 뚝배기와 한순간에 파르르 끓어오르는 양은냄비를 모두
        애용한다.한국인의 창조 유전자는 때로 적극성으로 표출된다. 해외에 나가보면 어딜 가도 한 번은 한국 사람을 마주칠 만큼 한국인들은
        세계 곳곳에 퍼져 있다. 미국 내 유학생 수도 중국 인도에 이어 세 번째로 많다. 어디 이뿐일까. 유대인은 세계 60여 개국에
        흩어져 살고, 중국인은 100여 개국에서 이민자로 살고 있는데 인구가 고작 5000만명에 불과한 한국 사람들은 175개국에 삶의
        터전을 잡았다. 저자는 “새로운 것에 대한 호기심과 굽힐 줄 모르는 도전정신이 만들어낸 결과”라며 “가진 것이라고는 맨몸뿐인
        사람들이 근면과 성실로 세계 곳곳을 파고들고 있다”고 말한다.
      - >-
        보험상품도 기프티콘 주고받는다면 ….최진환 현대라이프생명 대표. 대형마트에서 보험상품을 판매하고 최근에는 자판기에서도 보험상품을
        팔기 시작해 주목을 받고 있는데. 20, 30대를 겨냥해 보험상품을 선물하는 방안도 구상하고 있다고. 휴대폰으로 기프티콘을
        주고받는 것처럼 보험상품 기프티콘도 주고받을 날이 올지.박원순 “저의 재선을 의심하는 것 같다”19일 서울시청 브리핑룸. 박원순
        시장이 ‘서민 주거안정 대책’을 발표한 뒤 한 기자가 “재선 여부와 상관없이 계획을 추진하는 데 무리가 없겠느냐”고 질문.
        2018년까지 달성하겠다는 것은 재선을 염두에 둔 공약 아니냐는 얘기. 박 시장은 “저의 재선에 상당한 의문을 갖고 계신 것
        같다”면서….KT 광고 속 콧수염 인형은 ‘지드래곤’?KT가 방영 중인 ‘올레 광대역 LTE-지하철편’ 광고가 논란. 모자를
        삐딱하게 쓰고 콧수염을 기른 아저씨가 “광대역, 빨라요 빨라”라고 말하자 KT 모델이 “모든 지하철 안에서 다 되느냐?”고 묻고
        “안 되는구나”라고 말하는데, 이 아저씨가 LG유플러스 광고 모델인 지드래곤을 닮았으니.제프 베저스의‘언론 마법’은 통할까?
  - source_sentence: 미세먼지에 의한 질환이 아닌 것은 무엇인가?
    sentences:
      - >-
        미세먼지가 기승을 부리고 있다. 미세먼지는 몸속에 쌓이면 폐와 혈관 등에 문제를 일으킬 수 있다. 호흡기 질환자의 경우 기침,
        천식 증상이 악화되기도 한다. 외출 시 미세먼지 주의보 발령 여부를 확인하고 각종 건강 피해를 줄이기 위해 노력해야
        한다.미세먼지는 공기 중에 떠돌아다니는 중금속 등을 말한다. 지름이 10마이크로미터(㎛, 1㎛=100만분의 1m)보다 작아 폐나
        혈관으로 들어갈 수 있다. 미세먼지 노출이 사망률을 높인다는 연구 결과도 있다. 갑자기 많은 양의 미세먼지에 노출되면 기침,
        호흡곤란 등의 증상을 호소할 수 있다. 천식이 악화되고 부정맥이 생기기도 한다.미세먼지로 인한 건강피해를 막기 위해서는 외출할 때
        마스크, 보호안경, 모자 등을 착용하는 것이 좋다. 최천웅 강동경희대병원 호흡기내과 교수는 “미세먼지는 주로 호흡기를 통해 체내로
        들어온다”며 “만성폐쇄성폐질환 등 만성 호흡기 질환자는 외출 시 환경부 인증마크가 있는 방진마스크를 착용해야 한다”고 조언했다.
        나갔다 돌아오면 샤워를 해 머리카락이나 옷 등 몸에 남아 있는 미세먼지를 없애야 한다.미세먼지와 함께 세균 등이 호흡기를 타고
        몸속으로 들어오기도 한다. 이때 호흡기가 건조하면 외부에서 침투한 균을 배출하는 기능이 떨어진다. 이 때문에 호흡기를 촉촉하게
        유지해야 한다. 흐르는 물에 코를 자주 씻으면 미세먼지나 세균 등이 밖으로 나가는 데 도움이 된다. 만성 호흡기 질환을 앓는
        환자는 목 안이 건조하면 기침 등의 증상이 심해질 수 있다. 물을 두세 잔 정도 챙겨 마셔야 한다.집안에만 있다고 안심해선 안
        된다. 청소할 때는 창문을 닫고 하는 게 낫다. 만성 호흡기 질환자라면 일반 청소기 대신 미세먼지를 걸러주는 특수필터가 달린
        진공청소기를 사용해야 한다. 카펫이나 침구류에는 미세먼지가 쉽게 쌓일 수 있다.이를 예방하기 위해 섬유 재질 침구류 등은 수납장에
        넣거나 덮개를 씌워 놓는 것이 좋다. 미세먼지 농도가 낮아지거나 먼지 주의보가 해제되면 창문을 열어 환기해야 한다. 침구류 등도
        털어 실내에 쌓인 미세먼지를 제거해야 한다.
      - >-
        퇴거 위기에 처한 아동주거빈곤가구를 지원하기 위해 긴급임시주택 사업이 시작된다. 초록우산어린이재단(회장 이제훈),
        홈앤쇼핑(대표이사 김옥찬), 구로구청(구청장 이성), 서울주택도시공사(이하 ‘SH공사’, 사장 김세용)는 24일(목) 구로구청
        르네상스홀에서 「구로구 긴급임시주택 사업」의 업무협약을 진행했다. 본 업무협약을 통해 지난 7월 16일 시행된 「서울특별시 아동
        주거빈곤 해소를 위한 지원 조례안」에 따른 아동 대상 주거 정책을 현실화 할 수 있게 되었다. 서울의 일부 자치구와 지역
        주거복지센터에서는 기존에 약 40호의 긴급임시주택을 운영하며 갑작스럽게 퇴거 위기에 처한 가구를 위해 임시 주거 시설을
        제공해왔다. 하지만 반지하 주택 또는 노후 된 주택을 긴급임시주택으로 활용하거나 가족 단위로 생활할 수 없는 좁은 주택인 경우가
        많았다. 이 때문에 아동이 있는 가구를 위한 안전한 긴급임시주택이 필요한 상황이었다. 이번 업무협약에 따라 홈앤쇼핑이 가전, 가구
        등 긴급임시주택을 위해 필요한 물품을 후원하며 초록우산 어린이재단이 후원금 집행을 담당한다. SH공사는 긴급임시주택 운영을 위한
        매입임대주택을 유상 제공하고 구로구청은 긴급임시주택 운영과 함께 주거위기가구의 주거 상향을 위해 노력하게 된다. 서울에 사는
        지은(가명)이네 가족은 코로나19 위기로 부모님의 소득이 줄어들어서 5개월의 월세가 밀려 퇴거 위기에 놓여있었지만 이번
        긴급임시주택 사업을 통해 일시적으로 거주지를 마련할 수 있게 됐다. 거주하는 동안 다양한 지원체계를 연계해 안정적인 주거 계획을
        수립한다. 한편 「서울특별시 아동 주거빈곤 해소를 위한 지원 조례안」 조례 제정 및 이번 긴급임시주택 사업에 참여하는
        초록우산어린이재단 이제훈 회장은 “코로나 상황이 장기화 되면서 퇴거 위기에 놓인 가구가 늘고 있으며, 아동을 동반한 가구는 퇴거
        상황에서 겪는 어려움이 일반 가구에 비해 크다. 이번 구로구와의 사업을 시작으로 더 많은 자치구에서 사업이 진행되길 기대한다.
        또, 긴급임시주택에 입주한 위기 가구가 공공임대주택 및 일반 주거로의 주거 상향까지 이를 수 있도록 서비스를 제공하는 것도 중요할
        것이다. ”라고 기대감을 표시했다.
      - >-
        지난 12일 시공사 선정 입찰을 시행한 서울 태릉현대아파트 재건축조합은 결국 또다시 공사를 맡을 업체를 뽑는 데 실패했다. 이미
        세 차례나 유찰돼 이번에는 수의계약 방식으로 건설사를 지명할 수 있었지만 그마저 관심을 보이던 A건설사가 제안서 제출을 포기했기
        때문이다. 조합 관계자는 “이사회를 열어 앞으로는 한 업체가 단독으로 입찰에 참여하더라도 시공사 선정을 위한 주민총회에 상정해
        통과시킬 수 있도록 할 계획”이라고 말했다.재개발·재건축조합들이 헌 집을 헐고 새 집으로 지어줄 건설사(시공사)를 모시는 데 애를
        먹고 있다. 부동산 시장 침체가 장기화되면서 자금사정이 빠듯해진 건설사들이 계약조건이 유리하거나 분양성이 뛰어난 단지만 골라
        수주하기 때문이다. 최근 용인2구역 재건축사업도 참여 업체가 없어 시공사 선정 입찰이 유찰됐다. 오는 22일 입찰이 실시될
        예정이던 부천 원종3D구역 도시환경정비사업도 앞서 개최한 현장설명회에서 건설사가 단 한 곳도 나타나지 않자 입찰이 자동 유찰됐다.
        서울 자양1구역 재건축조합도 입찰이 표류 중이다. 서울 구산1구역과 홍제3구역은 수년 전 시공사를 교체하려고 계약을 해지했다가
        지금까지 다른 건설사를 찾지 못하고 있다.‘시공사 모시기’가 어려움에 처하자 주민들이 한 번 거절했던 시공사에 다시 ‘러브콜’을
        보내는 경우도 나타나고 있다. 서울 상도동 대림아파트는 대형주택 비율 등을 둘러싼 설계변경 건으로 B건설사와 본계약 직전에 계약을
        해지한 바 있다. 이후 새로운 시공사를 찾아나섰지만 입찰이 번번이 유찰되면서 결국 B업체에 다시 손을 내밀었다. 글로벌 금융위기
        이후 조합이 시공사를 바꾸는 사례는 적지 않았다. 시공사는 금융회사에서 돈을 빌려 조합에 사업비 등으로 대여해 주는데 재무상태가
        나빠진 건설사나 사업성이 떨어지는 사업장에선 제대로 자금이 지원되지 않았기 때문이다. 건설사들도 과거처럼 큰 자금을 쏟아부으며
        사업 수주를 위한 기득권 구축에만 매달리지 않는다. 소위 ‘될 사업’을 냉정하게 고른다는 의미다. 한 대형 건설사 영업담당 상무는
        “역세권도 아니고 시세는 떨어지는데 조합원들이 비싼 일반 분양가를 고집하면 답이 없다”며 “재개발·재건축은 주민 간 갈등으로
        사업이 늦어지는 등 리스크가 크기 때문에 건설사들은 신중히 사업장을 고르고 있다”고 설명했다.
  - source_sentence: 오스만 튀르크의 영토가 축소된 원인은?
    sentences:
      - >-
        미국과 영국, 프랑스 등지에서는 민주주의가 발전했다. 일본은 오세아니아의 군도에 대한 지배권을 확고히 할 수 있게 되었다.


        한편, 독일은 베르사유 조약으로 말미암아 반성보다 지독한 가난과 배상금에 대한 것에 시달렸으며 오스만 튀르크도 세브르 조약을
        맺음으로써 영토가 크게 줄어들었다(1922년 해체, 1923 터키 공화국 수립). 오스트리아와 헝가리도 각각 생제르맹 조약,
        트리아농 조약을 맺음으로써 영토가 크게 줄어들었다. 불가리아는 뇌이 조약으로 남도브루자를 루마니아에 떼어주었다.


        이탈리아는 승전국이었으나 연합국에게 영토를 보장받기는커녕 냉대를 받았다. 결국 1922년에 베니토 무솔리니에 의한 파시스트 정권이
        수립된다. 이탈리아와 마찬가지로 중국은 연합국임에도 불구하고 산둥 반도에 대한 이권을 돌려받지 못하였다. 우드로 윌슨의
        민족자결주의 원칙에 따라 중앙유럽의 많은 국가는 독립하였으며, 독립을 조건으로 영국을 도왔던 인도는  약속이 무산되자 지속적인
        투쟁 운동을 시작했다.


        한편, 우드로 윌슨 미국 대통령은 민족 자결주의를 제창하였으며, 전쟁의 방지와 세계의 평화를 위해 국제 연맹을 설립할 것을
        제안하였다. 이로써 국제 연맹이 설립되었으나, 정작 미국은 의회의 반대로 가입에 실패하였다. 결국 다시 고립의 길을 걸었다.
      - >-
        내과 외과 소아청소년과 산부인과 마취통증의학과 등 5개 ‘필수 진료과목’ 전문의(醫)를 모두 갖추지 못한 시·군·구가 전국
        251곳 가운데 27곳에 달했다. 교통사고나 심근경색 등으로 응급실을 찾은 환자를 전담하는 응급의학과 전문의가 없는 지방자치단체도
        51곳이었다. ▶관련기사 A3면건강보험심사평가원의 시·군·구별 ‘전문과목별 전문의 인원 현황’과 ‘표시과목별 의원 현황’에 따르면
        전문의 수는 최근 5년(2009~2013년) 사이에 1만명 넘게 증가했는데도 필수 진료과목 전문의를 다 갖추지 못한 지방자치단체는
        오히려 4곳 늘었다. 필수 진료과목이란 ‘응급의료에 관한 법률 시행규칙’에서 응급의료기관에 당직 전문의를 반드시 두도록 한 5개
        진료과목을 말한다.경북 영양군은 내과를 제외한 모든 필수 진료과목에서 전문의가 한 명도 없었다. 강원 양양군은 산부인과
        소아청소년과 마취통증의학과 등 3개 필수과목 전문의가 없다. 외과 전문의가 없는 지자체는 경북 봉화군·울릉군 등 3곳이었고
        마취통증의학과 전문의가 없는 곳도 강원 양구군, 충북 단양군 등 9곳에 달했다.소아청소년과 전문의를 찾을 수 없는 지자체는 충북
        보은군·괴산군과 전북 진안군 등 14곳, 산부인과 전문의가 없는 곳은 경북 고령군·의성군과 전남 구례군 등 12곳이었다.
      - >-
        “‘컴퓨터가 그리 좋으면 학교를 그만두라’는 엄마의 조언이 텀블러 설립의 발단이 됐다.”야후가 최근 인수한 마이크로 블로깅 사이트
        ‘텀블러’ 창업자 데이비드 카프(사진)의 성공 요인을 두고 주요 외신들이 전한 말이다. 여느 부모와 달리 컴퓨터에 빠져 살던
        14세 소년이 자신이 원하는 일에 몰두할 수 있도록 과감하게 학교 중퇴를 권유한 엄마의 결정이 20대 억만장자 탄생의 밑거름이
        됐다는 것이다.22일 뉴욕타임스 등에 따르면 그는 2000년 뉴욕의 일류 공립학교인 브롱크스과학고에 다녔다. 당시 14세인 카프는
        머리가 총명했지만, 내성적인 데다 하루 종일 컴퓨터에 빠져 살았다.그의 엄마 바버라 에이커먼은 “카프는 10대 소년이 그렇듯
        여자친구와 비디오 게임을 좋아했지만, 컴퓨터만큼 그를 매혹시키지는 못했다”며 “그의 열정을 살릴 공간이 필요했다”고 회고했다.
        당시 사립학교의 과학교사였던 에이커먼은 아들이 학교를 중퇴하는 대신 홈스쿨을 통해 학업을 계속하도록 했다. 이정선 기자
        [email protected]
  - source_sentence: 녹지 프리미엄 단지'라고 불리는 아파트에서 걸어서   있는 역의 이름은?
    sentences:
      - >-
        조환익 한국전력 사장(사진)이 서울 삼성동 한전 본사 건물을 매각하지 않겠다는 뜻을 내비쳤다. ‘선매각 후이전’이라는 정부의
        공공기관 혁신도시 이전 방침과 거리가 있는 데다 삼성생명 KB금융 등이 이 부지를 매입하기 위해 물밑 경쟁을 벌이는 상황이어서
        파장이 예상된다. 조 사장은 29일 지식경제부 출입기자들과 만나 한전 본사 건물에 대해 “(지금으로서는) 매각할 생각이 없다”며
        “일반매각보다는 향후 개발을 통해 수익을 창출하는 방안을 정부와 협의하겠다”고 말했다. 한전은 내년 8월 전남 나주 혁신도시로
        이전이 예정돼 있다. 정부 방침에 따르면 혁신도시로 본사를 옮기는 공공기관은 이전 전에 본사 건물을 매각해야 한다. 서울 삼성동
        한전 본사 부지는 7934㎡ 규모로 시가 3조원으로 추정된다. 서울 강남권에 위치한 사실상 마지막 금싸라기 땅이기 때문이다. 조
        사장은 또 연내 전기요금 추가 인상 가능성에 대해 “단정적으로 이야기할 수 없지만 현재로서는 전기요금을 추가로 인상할 생각이
        없다”고 밝혔다. 전기요금 누진제 축소와 관련해서는 “누진제를 통해 마련한 재원으로 빈민들에게 싸게 전기를 공급하는 것은
        좋다”면서도 “(일부 계층을 대상으로) 과도한 요금을 책정하는 것은 문제가 있다고 본다”고 설명했다.
      - >-
        LG생활건강의 한방 화장품 브랜드 ‘후’는 지난달 말 모델 이영애 씨와 11년 연속으로 계약을 갱신했다. 후가 연매출 약
        4300억원(지난해 기준)의 대형 브랜드로 성장하기까지 중화권 한류스타인 이씨의 공로가 컸다는 이유에서다. 후의 대표 제품인
        ‘비첩자생 에센스’가 ‘이영애 에센스’라는 별칭으로 불릴 정도로 양측은 끈끈한 관계를 이어오고 있다.빠르게 변하는 유행만큼 모델도
        자주 바뀌는 화장품업계에서 10년 이상 장수하는 ‘대기록’을 쓴 연예인이 속속 등장하고 있다.이씨 못지않은 장수모델로 10년째
        SK-Ⅱ 모델로 활동 중인 김희애 씨가 대표적이다. “놓치지 않을 거예요”라는 김씨의 광고문구는 SK-Ⅱ의 상징이 됐다. 회사
        측은 “SK-Ⅱ와 김씨는 이제 브랜드와 모델의 관계를 넘어 ‘가족’이라고 표현해야 할 정도”라고 했다. 국내 화장품 광고 역사상
        최장수 광고모델은 채시라 씨로 알려졌다. 1991년부터 2006년까지 15년 동안 코리아나 모델로 활동했다.화장품 광고에 자주
        등장하는 전지현 이나영 송혜교 등은 ‘특A급 모델’임은 분명하지만 브랜드를 여러 차례 갈아탔다. 전씨는 에뛰드 라네즈 한율 일리
        헤라, 이씨는 라네즈 아이오페 랑콤 숨, 송씨는 에뛰드 이니스프리 라네즈 등 다양한 브랜드의 모델로 활동했다.김태희 씨는
        2004년 LG생활건강 오휘 모델로 활동하다가 2006년 아모레퍼시픽 헤라로 바꾸고, 2011년 다시 오휘로 복귀한 독특한
        사례다. 이 과정에서 아모레퍼시픽과 LG생활건강이 거액의 모델료를 제시하며 치열한 ‘김태희 쟁탈전’을 벌이기도 했다.화장품업계
        관계자는 “화장품 브랜드가 많아지면서 모델 계약을 할 연예인이 ‘동이 났다’는 얘기가 나온 지 오래”라며 “1년 안팎의 단발계약이
        대부분이라 한 브랜드에서 장수모델로 활동하는 것은 대단히 어려운 일”이라고 말했다.
      - >-
        경기 용인시는 성남 분당신도시와 가까운 지리적 이점 덕분에 2000년대 중반 ‘버블세븐’으로 불리며 수도권 주택시장을 주도했지만
        과잉공급과 2008년 금융위기 여파로 미분양이 급증하면서 ‘불 꺼진 집’이 속출했다. 수도권 내 대표적인 미분양 지역으로
        꼽혔다.그랬던 용인 지역 분위기가 달라졌다. 수도권 전세난으로 매매 전환 수요가 늘면서 지난해 1만9055가구의 아파트가 거래돼
        수원시(2만280가구)에 이어 수도권 아파트 거래량 2위에 올랐다. 청약 열기도 달아올라 지난주 분양한 풍덕천동 ‘e편한세상
        수지’는 평균 8.29 대 1로 1순위에서 마감됐다.용인에서 최근 가장 주목받고 있는 곳은 처인구 역북지구다. 용인시청과
        용인교육청, 용인동부경찰서 등이 입주한 용인행정타운과 가깝고 인근 역삼지구와 함께 1만여가구 대규모 주거단지로 개발되고 있다.
        수지와 동백에 이어 용인을 대표하는 신흥 주거지로 떠오른 역북지구에서 우미건설이 이달 1260가구 규모의 ‘우미린 센트럴파크’를
        분양한다.○녹지율 40%의 1260가구 대단지처인구에서 가장 높은 34층 아파트로 1260가구 모두 전용 59·75·84㎡
        중소형으로 구성됐다. 모든 가구를 남향 위주로 설계했고 건폐율(대지 면적 대비 건물 바닥 면적 비율)이 12.8%에 불과해
        녹지율이 40%에 달한다. 근린공원 어린이공원과 맞닿아 있고 함박산도 끼고 있어 ‘녹지 프리미엄 단지’로 평가받는다.역북지구는
        용인 시내는 물론 서울로의 이동이 쉽다. 걸어서 갈 수 있는 용인 경전철 명지대역을 이용해 분당선 기흥역에서 환승하면 서울
        강남권까지 약 50분이면 도착할 수 있다. 2017년 개통 예정인 국도 42호선 대체 우회도로(수원신갈IC 방면)를 이용하면
        경부고속도로 기흥IC와 수원IC까지 거리도 12㎞ 정도로 줄어든다. 단지 바로 옆에 이마트가 문을 열고 초등학교가 들어설
        예정이다. 용신중학교와 용인고등학교도 가깝다.○중소 평형 ‘혁신 설계’ 도입중소형 특화 설계도 눈에 띈다. 모든 가구 주방을
        주부의 동선을 최소화하는 ‘ㄷ’자 형태로 배치했다. 전용 59㎡(A타입)에는 3개 침실에 모두 수납공간을 설치한다. 전용
        75㎡에는 현관 옆에 입구를 높인 ‘워크인 수납공간’을 제공한다. 전용 84㎡ 일부 타입에는 주방 대형 수납공간이나 작업공간으로
        활용할 수 있는 대형 주방을 들여 공간 활용도를 높였다. 일부 가구엔 레저용품 등을 보관할 수 있는 지하 창고도 제공한다.
        안전하게 택배를 발송·수령할 수 있는 무인택배시스템도 갖출 계획이다.방문한 친인척 등이 머무르거나 기념일 파티공간으로 이용할 수
        있는 게스트하우스를 설치한다. 입주자 휴식공간인 ‘카페 린’도 마련한다. 어린 자녀들이 통학버스를 안전하게 기다릴 수 있도록
        스쿨버스존을 설치하고 남녀 구분이 있는 독서실도 문을 연다. 실내골프연습장과 피트니스센터, 샤워실 등 커뮤니티시설도 마련한다.
        모델하우스는 용인시 역삼동 주민센터 옆에 문을 연다. 김보형 기자/김하나 한경닷컴 기자 [email protected]
  - source_sentence: 후속 공정에서 추가 비용 발생이 예상되는 설비를 주문한 나라는?
    sentences:
      - >-
        삼성중공업이 지난 1분기에 대규모 적자를 냈다. 해양플랜트 프로젝트의 잠재적 손실에 대비해 대규모 충당금을 쌓았기 때문이다.
        ▶본지 4월23일자 A13면 참조 삼성중공업은 1분기에 매출 3조4311억원, 영업손실 3625억원, 당기순손실 2724억원을
        기록했다고 25일 공시했다. 작년 1분기에 4402억원의 영업이익과 3005억원의 당기순이익을 냈던 것과 비교하면 큰 폭으로
        적자전환했다. 매출은 전년 동기 대비 11.7% 감소했을 뿐인데도 이익이 크게 줄어든 이유는 해양플랜트 프로젝트 손실에 대비해 약
        5000억원의 충당금을 쌓았기 때문이라고 회사 측은 설명했다. 앞서 지난 2월부터 삼성중공업의 해양플랜트 프로젝트와 관련해
        경영진단을 진행한 삼성그룹 컨트롤타워인 미래전략실은 대규모 부실이 있다고 판단하고 충당금을 쌓도록 했다. 삼성중공업 관계자는
        “2012년에 수주한 호주 인펙스프로젝트의 익시스(Ichthys) 해양가스처리설비(CPF)와 지난해 수주한 나이지리아
        에지나(Egina) 부유식 생산저장하역설비(FPSO) 등 2건의 해양플랜트 공사에서 손실이 예상된다”고 말했다. 그는
        “인펙스프로젝트의 CPF는 상세설계 등 후속 공정에서 사양이 바뀌면서 작업 물량과 비용이 증가했으며, FPSO는 나이지리아
        현지에서 생산 비용이 늘어날 것으로 보인다”고 덧붙였다. 삼성중공업은 2건의 해양플랜트 프로젝트 외에 다른 프로젝트는 정상적으로
        진행되고 있다고 밝혔다. 회사 관계자는 “예상 손실을 1분기에 반영한 만큼 2분기부터는 경영 실적이 정상 수준으로 회복할
        것”이라고 내다봤다.삼성중공업은 이날 실적전망 공시를 통해 올해 매출이 14조6000억원, 법인세 비용 차감 전 순이익이
        2000억원 정도일 것이라고 밝혔다.
      - >-
        차입금 갚기가 벅찬 한계기업 가운데 대기업이 늘면서 부실위험을 ‘대형화’하고 있다는 경고가 나왔다. 대기업 부실이 현실로 닥칠
        경우 전체 자금시장의 불안으로 번질 수 있다는 우려다. LG경제연구원은 3일 ‘부실위험 기업의 대형화가 금융회사 건전성을
        떨어뜨리고 있다’는 제목의 보고서에서 국내 금융회사의 부실자산 규모가 올 들어 지난 9월 말까지 6조8000억원 늘어난
        39조8000억원에 달했다며 이같이 분석했다. 이한득 연구위원은 “올 들어 증가한 부실자산은 대부분 은행에서 발생했는데 대기업
        대출이 특히 문제가 됐다”고 설명했다. 은행 부문의 경우 대기업의 부실채권 증가폭은 올 들어 9월까지 8조5000억원에 달해
        지난해 같은 기간의 3조2000억원을 훨씬 웃돌았다. 같은 기간 중소기업의 부실채권 증가폭은 10조4000억원으로 전년 동기와
        동일했다. 보고서는 올 들어 대기업의 부실 정도가 커지고 있다며 중소기업은 글로벌 금융위기 당시 구조조정이 상당히 진행된 반면
        대기업은 최근에야 부실이 현실화되기 시작했기 때문이라고 분석했다. 이자보상배율 1을 밑돌아 영업이익으로 이자도 갚지 못하는
        한계기업을 살펴봐도 대형화 추세가 두드러졌다. 전체 상장기업의 차입금 가운데 한계기업 차입금이 차지하는 비중은 2005년
        13.3%에서 올해 상반기 34.0%로 확대됐다. 한계기업의 평균 차입금이 같은 기간 1270억원에서 6799억원으로 5.4배 뛴
        데 따른 것이다. 한계기업의 차입금 가운데 대기업이 차지하는 비중이 93.2%에서 99.1%까지 치솟으면서 개별 부실의 덩치
        자체가 커졌다. 이 연구위원은 “상장사 가운데 한계기업의 차입금은 대부분 대기업이 갖고 있는 셈”이라며 “1개 대기업의 부실은
        25개 중소기업의 부실과 비슷할 정도로 시장에 미치는 영향이 크다는 게 문제”라고 우려했다.보고서는 위험을 최소화하려면 선제적인
        구조조정이 해답이라며 부실 가능성이 높은 기업을 선별해 추가적인 자금 공급을 억제해야 부실 확산을 막을 수 있다고 지적했다.
      - >-
        1967년 제3차 중동 전쟁에서 이스라엘의 압도적인 승리에 이어 아랍 단체들의 다수는 영토를 회복하고 다른 목적들을 추진하는 데
        전통적인 각 주 간의 교전 상태로 양자 택일들을 찾고 있었다. 이스라엘은 되풀이적으로 팔레스타인의 피다인 게릴라들에 의하여 국경을
        건너는 공격들에 의하여 타격되었다.


        1970 9 1 국왕을 암살하는  몇몇의 시도들이 실패하였다. 9 6 팔레스타인 해방대중전선의 납치 사건들의 연속들에서
        3대의 항공기가 그들에 의하여 납치되었는  자르카에 상륙한 스위스 항공과 TWA 항공, 그리고 카이로에 상륙한 팬아메리칸
        항공이었다. 9 9 당시 바레인으로부터 영국해외항공 항공기도 또한 자르카로 납치되었다. 전부의 인질들이 옮겨진 후, 항공기들은
        지시적으로 텔레비전 카메라들 앞에 폭발되었다. 국왕을 직접 맞서 화나게  반란자들은 이르비드 지역을 "해방된 지방"으로
        선언하였다.


        9 16 후세인 국왕은 계엄령을 선포하였다. 이어진  요르단의 탱크들은 암만에 있는 팔레스타인의 기구들의 본부들을
        공격하였고, 육군은 또한 자르카, 이르비드, 살트와 스웨일레에 있는 진영들을 공격하기도 하였다.


        1970 9월은 검은 9월로 알려졌으며 어쩌다 "후외적인 사건들의 시기"로서 언급되었다.  일은 34세의 군주가 성공적으로
        자신의 왕정을 타도하는 시도들을 진압한 한해였다. 폭력은 양쪽으로부터 7천에서 8천의 사망에 결과를 가져왔다. 무장한 분쟁은
        팔레스타인 해방 기구와 수천명의 팔레스타인인들을 레바논으로 배제와 함께 1971 7월까지 지속되었다. 


        결과로서 후세인이 조국에서 인기를 유지하였어도 아랍 세계는 10년간 세월의 나머지를 통하여 그를 크게 고립시켰다. 1974 아랍
        지도자들은 팔레스타인 해방 기구를 "팔레스타인 국민의 단 하나의 합법적인 대표" 선언하여 요르단강 서안 지구의 팔레스타인인들을
        위한 연설자로서 후세인의 역할을 가져갔다.


        지미 카터 미국 대통령, 안와르 사다트 이집트 대통령과 메나헴 베긴 이스라엘 총리 사이의 1978 캠프데이비드 협정은 요르단의
        후세인 국왕을 들어오지 못하게 하였다. 이어진  후세인 국왕은 유엔 총회 연설에서 협정을 비난하였다.  입장은 그와 조국이
        필요하던 다른 아랍 지도자들과 우호를 재설립하는 도움을 주었다. 

         후세인은 팔레스타인 해방 기구의 지도자 야세르 아라파트와 화해에서 전혀 성공적이지 않았고, 결국 1988 요르단강 서안 지구의 행정적과 법적의 통치로 요르단의 주장을 포기하였다.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - pearson_cosine
  - spearman_cosine
model-index:
  - name: SentenceTransformer based on bandi2716/klue-roberta-base-klue-sts
    results:
      - task:
          type: semantic-similarity
          name: Semantic Similarity
        dataset:
          name: Unknown
          type: unknown
        metrics:
          - type: pearson_cosine
            value: 0.8338263197752105
            name: Pearson Cosine
          - type: spearman_cosine
            value: 0.8345125105582641
            name: Spearman Cosine

SentenceTransformer based on bandi2716/klue-roberta-base-klue-sts

This is a sentence-transformers model finetuned from bandi2716/klue-roberta-base-klue-sts. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: bandi2716/klue-roberta-base-klue-sts
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: RobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    '후속 공정에서 추가 비용 발생이 예상되는 설비를 주문한 나라는?',
    '삼성중공업이 지난 1분기에 대규모 적자를 냈다. 해양플랜트 프로젝트의 잠재적 손실에 대비해 대규모 충당금을 쌓았기 때문이다. ▶본지 4월23일자 A13면 참조 삼성중공업은 1분기에 매출 3조4311억원, 영업손실 3625억원, 당기순손실 2724억원을 기록했다고 25일 공시했다. 작년 1분기에 4402억원의 영업이익과 3005억원의 당기순이익을 냈던 것과 비교하면 큰 폭으로 적자전환했다. 매출은 전년 동기 대비 11.7% 감소했을 뿐인데도 이익이 크게 줄어든 이유는 해양플랜트 프로젝트 손실에 대비해 약 5000억원의 충당금을 쌓았기 때문이라고 회사 측은 설명했다. 앞서 지난 2월부터 삼성중공업의 해양플랜트 프로젝트와 관련해 경영진단을 진행한 삼성그룹 컨트롤타워인 미래전략실은 대규모 부실이 있다고 판단하고 충당금을 쌓도록 했다. 삼성중공업 관계자는 “2012년에 수주한 호주 인펙스프로젝트의 익시스(Ichthys) 해양가스처리설비(CPF)와 지난해 수주한 나이지리아 에지나(Egina) 부유식 생산저장하역설비(FPSO) 등 2건의 해양플랜트 공사에서 손실이 예상된다”고 말했다. 그는 “인펙스프로젝트의 CPF는 상세설계 등 후속 공정에서 사양이 바뀌면서 작업 물량과 비용이 증가했으며, FPSO는 나이지리아 현지에서 생산 비용이 늘어날 것으로 보인다”고 덧붙였다. 삼성중공업은 2건의 해양플랜트 프로젝트 외에 다른 프로젝트는 정상적으로 진행되고 있다고 밝혔다. 회사 관계자는 “예상 손실을 1분기에 반영한 만큼 2분기부터는 경영 실적이 정상 수준으로 회복할 것”이라고 내다봤다.삼성중공업은 이날 실적전망 공시를 통해 올해 매출이 14조6000억원, 법인세 비용 차감 전 순이익이 2000억원 정도일 것이라고 밝혔다.',
    '차입금 갚기가 벅찬 한계기업 가운데 대기업이 늘면서 부실위험을 ‘대형화’하고 있다는 경고가 나왔다. 대기업 부실이 현실로 닥칠 경우 전체 자금시장의 불안으로 번질 수 있다는 우려다. LG경제연구원은 3일 ‘부실위험 기업의 대형화가 금융회사 건전성을 떨어뜨리고 있다’는 제목의 보고서에서 국내 금융회사의 부실자산 규모가 올 들어 지난 9월 말까지 6조8000억원 늘어난 39조8000억원에 달했다며 이같이 분석했다. 이한득 연구위원은 “올 들어 증가한 부실자산은 대부분 은행에서 발생했는데 대기업 대출이 특히 문제가 됐다”고 설명했다. 은행 부문의 경우 대기업의 부실채권 증가폭은 올 들어 9월까지 8조5000억원에 달해 지난해 같은 기간의 3조2000억원을 훨씬 웃돌았다. 같은 기간 중소기업의 부실채권 증가폭은 10조4000억원으로 전년 동기와 동일했다. 보고서는 올 들어 대기업의 부실 정도가 커지고 있다며 중소기업은 글로벌 금융위기 당시 구조조정이 상당히 진행된 반면 대기업은 최근에야 부실이 현실화되기 시작했기 때문이라고 분석했다. 이자보상배율 1을 밑돌아 영업이익으로 이자도 갚지 못하는 한계기업을 살펴봐도 대형화 추세가 두드러졌다. 전체 상장기업의 차입금 가운데 한계기업 차입금이 차지하는 비중은 2005년 13.3%에서 올해 상반기 34.0%로 확대됐다. 한계기업의 평균 차입금이 같은 기간 1270억원에서 6799억원으로 5.4배 뛴 데 따른 것이다. 한계기업의 차입금 가운데 대기업이 차지하는 비중이 93.2%에서 99.1%까지 치솟으면서 개별 부실의 덩치 자체가 커졌다. 이 연구위원은 “상장사 가운데 한계기업의 차입금은 대부분 대기업이 갖고 있는 셈”이라며 “1개 대기업의 부실은 25개 중소기업의 부실과 비슷할 정도로 시장에 미치는 영향이 크다는 게 문제”라고 우려했다.보고서는 위험을 최소화하려면 선제적인 구조조정이 해답이라며 부실 가능성이 높은 기업을 선별해 추가적인 자금 공급을 억제해야 부실 확산을 막을 수 있다고 지적했다.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Semantic Similarity

Metric Value
pearson_cosine 0.8338
spearman_cosine 0.8345

Training Details

Training Dataset

Unnamed Dataset

  • Size: 17,552 training samples
  • Columns: sentence_0 and sentence_1
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1
    type string string
    details
    • min: 8 tokens
    • mean: 17.68 tokens
    • max: 35 tokens
    • min: 229 tokens
    • mean: 438.65 tokens
    • max: 512 tokens
  • Samples:
    sentence_0 sentence_1
    2012년에 부일장학회의 주식반환에 대해 기각 결정을 내린 재판부는? 진실규명 결정을 받은 김지태의 유가족들은 2010년 6월에야 법원에 정수장학회와 국가를 상대로 낸 주식양도 등 청구소송을 냈다. 김씨 측은 "박 전 대통령이 사망하고 난 이후 1980년에 토지 반환청구 의사를 표시했고, 과거사정리위원회의 진실규명 결정을 송달받은 이후 손해배상을 청구한 것이므로 공소시효가 남아있다"고 주장했다.

    하지만 1심 재판부는 "소멸시효가 지났다"며 김씨 측의 청구를 기각했고, 2심 재판부도 김씨가 국가의 강박행위로 인해 재산을 헌납한 것은 인정하면서도 의사결정권이 완전히 박탈당한 상태는 아니었던 것으로 판단해 원고 패소 판결했다. 2012년 2월 24일 서울중앙지법 민사합의17부(재판장 염원섭)에 의해 5.16장학회의 ‘헌납’ 과정에서 강압이 있었음이 다시 한 번 입증되었다. 하지만 재판부는 김영우가 제기한 과거 부일장학회의 주식반환에 대해서는 공소시효 소멸을 이유로 기각하였다. 이에 국가의 범죄에 대해서는 공소 시효의 범위를 폭넓게 인정해줘야 한다는 비판도 제기되었다.

    대법원은 2014년 2월 13일 김지태씨 장남 영구 씨를 비롯한 유가족 6명이 정수장학회와 국가를 상대로 낸 주식양도 등 청구소송 상고심에서 심리불속행 기각 결정을 내렸다. '심리불속행'은 상고 사건 가운데 상고 대상이 아니라고 판단되는 사건은 더이상 심리하지 않고 기각하는 제도다.
    투자의 귀재'라 불리는 사람이 올해 번 돈은 얼마인가? 올해 전 세계에서 누가 가장 많은 돈을 벌었을까.미국 경제매체 마켓워치는 ‘투자의 귀재’ 워런 버핏 벅셔해서웨이 회장이 올해 세계에서 가장 많은 돈을 벌었다고 18일(현지시간) 보도했다. 스위스 자산정보업체 웰스엑스(Wealth-X)와 UBS 은행의 조사 결과 올초 464억달러였던 버핏의 자산이 127억달러(약 13조4500억원) 늘어 지난 11일 기준 591억달러가 됐다. 하루에 3700만달러(약 392억원)를 벌어들인 것이다. 빌 게이츠 마이크로소프트 회장은 726억달러의 자산을 보유해 1위 부자 자리를 지켰지만, 올해 버핏보다 적은 115억달러를 벌어 ‘올해 돈 많이 번 사람 순위’에서는 2위에 머물렀다.3위는 자산이 114억달러 증가한 카지노 업계의 거물 셸던 애델슨 라스베이거스샌즈 회장이 차지했다. 애델슨 회장은 지난 2월 방한해 “한국에 내국인 출입이 가능한 ‘오픈 카지노’ 설립 허가가 나면 40억60억달러(약 4조3000억6조5000억원)를 투자할 의향이 있다”고 밝힌 바 있다.113억달러를 번 제프 베저스 아마존 최고경영자(CEO)와 105억달러를 번 마크 저커버그 페이스북 CEO가 각각 4위와 5위에 올랐다. 특히 저커버그는 올해 모바일 광고 매출 증가로 페이스북 주가가 급등하자 자산가치가 크게 늘어난 경우다.6위는 103억달러를 번 손정의 일본 소프트뱅크 회장이었으며, 구글 공동 창업자인 세르게이 브린(93억달러)과 래리 페이지(93억달러)는 나란히 7위와 8위를 기록했다. 9위는 뤼즈허 갤럭시 엔터테인먼트 회장(83억달러)이, 10위는 행동주의 투자자 칼 아이칸(72억달러)이 차지했다.웰스엑스는 “현재 전 세계에는 2170명의 억만장자가 있다”며 “이들의 자산은 미국발 금융위기 직후인 2009년 3조1000억달러에서 올해 6조5000억달러로 늘었다”고 설명했다.
    DDP를 설계한 건축가의 출신 국가는? 옛 서울 동대문운동장 부지에 들어선 ‘동대문디자인플라자(DDP)’가 내달 21일 개장을 앞두고 파격적 위용을 드러냈다. 설계 당시부터 뜨거운 찬반 논란과 함께 화제를 모았기 때문에 준공 이후 서울의 ‘글로벌 명물 건축’으로 부상할 수 있을지 관심이 쏠리고 있다. 영국의 세계적 건축가인 자하 하디드(이라크 출신 여성건축가)가 국제현상공모를 통해 건축설계를 맡았다. 미확인 비행물체(UFO)가 연상될 정도로 이색적인 ‘비정형 건물(형태가 일정치 않은 건물)’이어서 건축계에 큰 파장을 일으켰다. 동대문 일대의 역사성과 지역성이 무시된 독불장군형 디자인이란 혹평과 미래 동대문의 발전상이 함축된 창조성이 돋보인다는 호평이 엇갈리면서 한동안 논쟁이 뜨거웠다. 건물의 비정형성이 워낙 강해 시공사인 삼성물산도 공사에 어려움이 많았다. 시공과정에서 첨단기술 적용은 물론 적잖은 진기록도 쏟아졌다. 같은 크기의 일반 건물(정형 건물)에 비해 공사기간도 거의 2배 이상(4년8개월) 걸렸다. 건물 외장을 감싸고 있는 알루미늄 패널(가로, 세로 1.5m)만도 4만5133장이 쓰였다. 패널이 모두 제각각이어서 공장 생산이 아닌 별도 제작으로 맞춰 붙였다. 건물 외관 면적이 축구장 3배 크기에 달했다. 삼성물산은 국내 공공공사 최초로 3차원 입체설계 방식인 BIM을 활용해 이들 패널을 제작했다. 비정형 외관의 노출 콘크리트 작업도 초고층 빌딩을 능가하는 난공사였다. 이진배 삼성물산 PM(프로젝트 매니지먼트) 상무는 “BIM 모델을 통해 새로운 거푸집 공법을 개발해 적용했고, 각기 다른 곡선과 형태로 설계된 실내 공사에서는 실물 크기 모형을 수차례 제작해 설계 원안의 느낌을 최대한 살렸다”고 말했다.
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • num_train_epochs: 1
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: round_robin

Training Logs

Epoch Step Training Loss spearman_cosine
0 0 - 0.8345
0.4558 500 0.1638 -
0.9116 1000 0.1069 -

Framework Versions

  • Python: 3.10.12
  • Sentence Transformers: 3.3.1
  • Transformers: 4.47.1
  • PyTorch: 2.5.1+cu121
  • Accelerate: 1.2.1
  • Datasets: 3.2.0
  • Tokenizers: 0.21.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}