Jump to...
redirecting...

Log for YSITD

他們有還願
你好喔
你好
大家好,我是來探討電腦學問的
請多多指教
笑 :)
你好
這裡是RSD
RSD 是?
富貴學生交流群組
?
以上
看他,叫TELSA V1000
這裏不是IT 討論區嗎
富貴IT群組
tsla 股價是不斷上升的說😂😂
[sticker](media:AAMCBQADHQI9ls-AAAEUXfheVAgBge9F2tkfYiErKNM4-rA3EAACXAADaoJzDF_k_Z2FXNP9M_kaMwAEAQAHbQAEAQACGAQ@telegram)
今天跌了66...
早會兒才升了100
一群有錢 不年輕的學生 在討論事情
當然不包括我
例如licson?
licson 是李老闆?
金主
看起來很讚的杯子
適合送禮
[photo](media:AgACAgIAAx0CPZbPgAABFF4DXlQI2RSeBspbqcmZHvhc-s284Y8AApesMRuunKFKdxeG_iqlKed0n3WRLgADAQADAgADbQAD2D4AAhgE@telegram)
你們認識他喔?
他是有錢人家
[sticker](media:AAMCBQADHQI9ls-AAAEUXgZeVAmybes5z15v2xdUqKSEmVJqigACBgADRaQ7ENjSV9tgaI3J4ZH5MgAEAQAHbQADXFMAAhgE@telegram)
他弄vpn 弄得有聲有色呀
原來如此
所以你的 V100 呢 😄
活在ID裡
原來如此
笑死ww 感覺超讚
台灣哪裡買的到啊(#
問,有沒有人在 maintain 一個 list 包含所有知名網域(TQDN only)中,哪些 domain 的 subdomain 是可以給大眾註冊的
例如 Amazon 的 cloudfront.net,Automattic 的 wordpress.com
tag 可能會知道這種問題的 @licson @lekous @seadog007 @S_ean
頂多有部落格在介紹
我是問 TQDN 不是 TLD qq
用途?光這樣看感覺很沒必要欸
做一個 list 出來也太招搖XDD
例如我看到 blablabla . wordpress . com,這個 domain 的維護者可能跟 wordpress . com 是不一樣的
我也覺得 Top 30 most XXX XXX 這種文比較有機會
或是中國人的部落格
好吧,謝謝 QQ
你要幹嘛ㄚ
我要從一整個 domain pool 中找出哪些 domain 是可信任的
WHOIS 不能用,因為有 subdomain
certificate 可以用,但不是每個網站都有 HTTPS
ranking 可以用,但是要扣掉 cloudfront 這種可以讓註冊 subdomain 的 case
你找一下domain takeover
那是一種神秘攻擊手法
喔喔,這個我好像之前讀過,沒想過可以從這方面下手 OAO
謝謝!
從public suffix list找不是國家/頂級域的
可信任的 domain 是啥ww
有點常識的公開網域維護者應該都會申請上去
不然會被cookie bomb打爛
啥?
子網域跟父網域維護者不一樣的基本都會在上面
太酷了,謝謝!!!!!!!!!!!!!!!!!!!!!
我要的就是這個!!!!
大感謝 <(_ _)>
瀏覽器是按照這個列表決定什麼情況下你不能把 cookie 往父網域設的
因為假設你是 .com 擁有者,你不會希望任何人
現在 chrome 好像又管更嚴了
謝謝 <(_ _)>
好像還會因為subdomain的頁面有安全問題
直接把整串DN列為不安全
[photo](media:AgACAgUAAx0CPZbPgAABFF4vXlTANaiDeWh9WSUrXHsvRbwuQlAAAiGpMRvWmKhW-CozgaYFpZp-iG9qdAADAQADAgADbQADNrMAAhgE@telegram)
幹你娘笑死
Firefox 網址列會標示 suffix 的部分 yay
@wyork507 問,你覺得太魯閣還是普悠瑪比較晃
普超晃吧
除非沒其他車可以搭,不然我不太會去搭普,容易暈車
Hmm
我覺得太比較晃
好吧 QQ
不然就是太久沒搭太了不習慣(
東部好像還是普多於太
但如果推拉式自強跟普,我還是秒選普啦,推拉式自強真的太破了
地震啦
有喔?
喔 我以為是我椅子壞掉了
嗯 震央在花蓮
對不起(
無感
還想說我有這麼肥嗎
我躺在床上開會所以很有感
所以你跌倒了嗎
廢話一定是普
因為傾斜角度差了三度
可是普好快
想請教個,現在我有一包有著「IP」與「數量」的 dataset,每個 data point 看起來會是:「1.1.1.1 有 3 個,8.8.8.8 有 2 個」
現在我想要算每個資料點散佈的程度(例如 entropy),其中我希望當下面兩種情況時算出來的數值要高一點
1. {1.1.1.1: 10} (全部都對應到同個 IP)
2. {1.1.1.1: 1, 1.1.1.2: 1, 1.1.1.3: 1, 1.1.1.4: 1, 1.1.1.5: 1, 1.1.1.6: 1} (分佈明顯有規律)
當很明顯就是一大堆不同網段的 IP 時,算出來的數值要小一點

有什麼好的方法可以達到這個要求
等等會有人出來說你問題沒有 well define,沒有意義,再說你不懂演算法他才懂ㄛ
[sticker](media:AAMCAgADHQI9ls-AAAEUXkxeVS1ALTAzrkGyElA7-tjPju02zQACigEAAvcclwJnDMuTeTRch3cjuA8ABAEAB20AA4NgAAIYBA@telegram)
..... 那你要拯救一下我嗎
你們兩個不如結婚
🌈
{1.1.1.1:3}跟{1.1.1.1:2, 1.1.1.2:2}誰比較大
{1.1.1.1: 3}
當數量偏向集中時,數量越集中分數越高,當全部都一樣時最高
當數量偏向分散時,IP 越接近分數越高
(a, b) = (1.1.1.1, 1.1.1.2)
那 a:3 b:1 跟a:2 b:2 ㄋ
你把
IP 換成十進位
他就會在某個數線上
我覺得大概對就可以了,這種狀況接近的沒差其實
然後求標準差 四分位數之類的
Wow 詳細
回歸到高中統計學
IP 本質不就是數字ㄇ
從 0 開始
標準差不能表達出雙峰ㄅ
反正就是一堆數字的集中程度
可是這要用什麼指標
例如 192.168.0.1 是 3232235521 之類的
我就爛 我什麼都不知道(X
而且這其實有個問題是 1.1.255.255跟1.2.1.1 會太近
不過應該 還好
他們本來就很近
把他換成數線算 entropy 呢?
你是不是沒看內文
要避免的話 可以先把 IP 都先對應到 /24
你是不是沒看內文
:(
但你要先切/24ㄅ
反正換成數線之後就回歸到高中統計ㄌ
++
[photo](media:AgACAgUAAx0CPZbPgAABFF5xXlUxGg_jf-oN4DXNMpuJS_X8ub8AAlyqMRvRNbFWmtWbloUBmiuaIxszAAQBAAMCAANtAAMheAQAARgE@telegram)
先 map 到 /24
你是要貼這個ㄅ
或是你可以加權
例如 1.1.1.1: 2, 1.1.1.2: 3 換成
[16843009, 16843009, 16843010, 16843010, 16843010]
然後算 entropy,這樣可行嗎
但我覺得這寫起來很累
不行
那該怎麼辦 QQ
你先寫寫看R
我笨不會

1.2.3.4 變成 1.2.3.0
就1.1.1.1到1.1.1.255都變成1.1.1.08
以一個 /24 為單位去計算
Hinet:
Home ISP:
要當成嘉全啦
可是也有 cass 是 1.1.1.11.1.2.1
不能直接拿去算
這兩個很遠啊(?
這是在/22底下ㄅ
但他整排是 1.1.1.1, 1.1.2.1, 1.1.3.1, 1.1.4.1
所以我說要從/32 /31 /30 /29
這樣加權回來
加到/16應該就行了
好主意
然後最後取超過 50% 的區段和
那該怎麼選 weight
照 IP 數量應該可以
話說可以求 python script 嗎,我感覺我沒有到非常懂 QQ
entropy 可以用 scipy.stats.entropy 算
敗偷 OAO QQ
我不會 scipy ayy
我覺得大概是
scores
(a)
range = /32 (weight = 1)
把每個 IP 都 map 到 range 下
把每個 range 依照 weight 跟出現次數計算加權分數
把每個 range 得出的分數分別加回原本 IP 的得分
(b) 找出最高的連續區間的得分
粗略的算法 ya
try and error (
這邊的 entropy 定義是什麼ㄚ
++
或是把weight倒過來,獎勵小區間ya
為什麼要求entrypoy
hmm 倒過來好像比較好ㄛ
本來就應該獎勵小區間ㄅ
見 definition
ya
那 weight 就用 1/($range_ip_count) ㄚ
不是
我覺得你一開始問題就很怪
例如 /24 的 weight 是 1/255 之類的
++
你要不要先講一下你要幹嘛
對應回來之後
搞不好有其他更好的做法
取平均跟標準差
取兩個標準差內
你 PX 怎麼訂的
我們直接被你做法侷限(?
就知道集中的 IP 跟 range ㄌ
好,我的處境是,我透過了一個方法找到了一系列可能的 malicious domain(嚴格來說是好幾個不同的 malicious domain set),但我要去驗證說我找到的 malicious domain 是對的
因為我是從一個小 set 去推廣出大 set,所以如果能證明這一包潛在 malicious domain 跟原本已知為真的 malicious domain 在同個 IP 或是足夠接近,那就比較有信心可以說他也是 malicious domain
你講話好elite
幹嘛不查 whois
惡意網域更煩好ㄇ
會出現 subdomain
所以 whois record 不可信,我嘗試過了
那你應該找distance啊
:(
++
詳細
為什麼是找整個list的entropy
不懂,求詳細
你有信心有害網域一定會大量出現ㄇ
沒有的話你求熵或是集中程度就沒有意義
你去算你假設的惡意IP跟現有已知惡意IP中每一筆的Distance
現在就是有找到這種現象惹,所以我才想追下去阿 QQ
取加權總和
可以多迭代幾次
可以參考OSU PP計算方法(X
取得精確的母體資料庫 yay
怎麼定義 distance(例如像是剛剛 map 到數線上?)以及怎麼加權
你直接看他在/32還是/31還是/30這樣下去
我剛剛的笨演算法應該可以給尼歸納在某個網段的 IP 集中程度的
某種加權值
我覺得你可以用那個試試看
可是問題就是我聽不懂 QQ
不是根本不用算IP集中程度
剛剛那個加權值就是
我沒有要加權啊._.
IP 分佈 + 小區間獎勵 ya
那是總和加權
那是你的什麼神秘專題嗎
還是什麼
台大 Elite
不是,我自己好奇做的
就單純突然腦袋炸出一個想法,想去驗證這想法對不對而已
好喔
欸不是,所以你們討論出結果沒(?
稍等我一下
我寫給你看
求 pseudocode / python script,後者尤佳(?
我想說是專題我就要叫你付錢
掛名
救我,感謝
下次遇到你請你喝飲料啦 Zzzzz
不要問我 我不知道怎麼寫 我只能給你剛剛我提的算法的扣www
github 88888?
好沒 他只是 response time 30s 而已
[photo](media:AgACAgUAAx0CPZbPgAABFF7cXlU68I_sawUVXms2Rvej-t1ePsEAApmpMRvWmLBW5Qsz_67lIa3rOhszAAQBAAMCAANtAAPxdQQAARgE@telegram)
distance 算法我還要改
被叫去玩牌了
不過你要的效果應該是這樣
我們不是要做兩個 object 的比較嗎
沒有很懂這是什麼意思 QQ
第一行第一組是疑似的
第二組是已知的列表
求 code
晚點
被同學叫去打牌 不好拒絕QQ
就說你直接講目的會比較快(
不要想一堆奇怪解法然後叫大家幫你實現(
慟,那晚點拯救我
把ip 當成4D coordinates?
用簡單n-mean distance 算法
https://pastebin.com/xFv3Kgaf
不知道會不會動 不知道有沒有用 但是你姑且看看(
演 *
為什麼要把他當4d coonrdinate
不行
ip不是這樣運作的
你這樣
除了 /24 /16 /8 以外
都不會動
我理解錯了
你不是想純粹計算dispersion...
e-lite
好他們好慢
我把電腦抓來ㄌ
[photo](media:AgACAgUAAx0CPZbPgAABFF76XlU9PEzEqztOIow1HFlb9KPQ38EAApupMRvWmLBWCgWytpohHW9ybWlqdAADAQADAgADbQADarcAAhgE@telegram)
dist func可能要改
這樣太接近了
@s3131212 夠短夠好懂ㄅ
你要做的只剩tune function/參數
喔幹不對
! 我查查
我忘記sort
為甚麼你們都會 py
py 好麻煩
你要寫 JS 我也不反對啦(?
我剛剛跑ㄌ
我的扣會動喔
[photo](media:AgACAgUAAx0CPZbPgAABFF8IXlU9xJMyMNM0J5lne8V-FFjMrOEAApypMRvWmLBW5si279nHqKyGbWlqdAADAQADAgADbQADNLUAAhgE@telegram)
除了 has_key 要改掉以外 yay
但是你的input很怪(
ips= {"1.1.1.1": 3, "1.1.1.2": 5, "192.168.1.0":3}
Output: {'1.1.1.1': 8.4998779296875, '1.1.1.2': 11.4998779296875, '192.168.1.0': 5.9999542236328125}
我覺得某種程度上還算有參考價值
不是 他給的東西就很怪R
反正我做一半了(
你應該是拿可疑去比已知
+++
但你只剩一個ips
但是他可能沒有已知
想要找出集團在哪
之類的
有ㄅ 他剛剛不就說已知了ㄇ
[sticker](media:AAMCBQADHQI9ls-AAAEUXxZeVT5H12vqI1OORS8MA8wSJ6Ik3AACTwEAAu4RlQw1fF-FkkyJJcb4GjMABAEAB20AA79CAAIYBA@telegram)
欸不是,你就不能給複製嗎 XD
import socket

mips = open('mips').read().strip().split('\n')
known = open('known').read().strip().split('\n')

def dist(a, b):
    def to_num(addr):
        quads = map(ord, socket.inet_aton(addr))
        return reduce(lambda x,y: x * 0x10000 + y, quads)
    return abs(to_num(a) - to_num(b))

def score_cal(oscore):
  t = 0
  for i in range(len(oscore)):
    t += oscore[i] * 0.95**i
  return t

print(mips, known)
m = dist('0.0.0.0', '255.255.255.255')

for i in mips:
  score = []
  print(i)
  for j in known:
    #print(i, j)
    score.append((m - dist(i, j))//1e15)

  #print(score)
  score.sort()
  score.reverse()
  print(score_cal(score))
笑死
我想說這樣有hl
dist我沒有寫 我抄來的
你可以改用 @lekous 那個
應該會好一點
所以 known 是已經確認是 malicious,mips 是我推出來的?
mips = malicious IPs
前者對
後者我不知道你指的是什麼
Y
直接變成 IPv4Address Object
然後相減
就是距離了
um
是嗎
[photo](media:AgACAgUAAx0CPZbPgAABFF8oXlU-4OBJnRQbhkSMImn8XYUnB_oAAp6pMRvWmLBWxTePqJDLPOW6IhszAAQBAAMCAANtAANfeAQAARgE@telegram)
我看起來有八成會成功啦
看起來很危險
他內部是
換成 int 去算了
有趣
IPv6 也是那樣算
>>> int(ipaddress.IPv6Address('::1'))
1
對呀
ipv4 就是32bit data
啥?
所以 known 是已知為 malicious ip
mips 是我想驗證的潛在 malicious ip
還是反之?
所以把它當作int32 來算🤔🤔
他都叫known了._.
好像哪裡怪怪的
你那個扣
不對吧
是不是會有 n^2 的資料跑出來
你這樣1.1.1.255 跟1.1.2.1
對吧
只差1
distance 不就是這樣ㄇ
所以我才要對網段加權
ya
不是
同一subnet dispersion 但是較細
所以要做類似加權的操作
@seadog007 其實我沒有很懂你現在的邏輯
我要算分數的是一整個 set 裡面,距離已知 IP 的分散狀況,不是 set 裡面的每一個 IP 欸
取 mean 會爛掉嗎 OAO
不然拿我加權後的分數當作次數套你那個蒜
另一問題是 1.1.1.1 1.1.2.1 與 1.1.1.1 1.1.255.1 的dispersion 應該是一樣的
取 mean 會爛ㄅ
中位數或眾數之類不會比較好嗎?
會啊
取平均的話,這樣只要有一批靠北遠,平均就會起飛了耶?
所以要sort加權
你們要不要考慮用 BGP 表解決問題(
@seadog007 幫我寫完啦 QQ
我開始混亂了
我是先取CIDR的頭的 IP 再去算
所以沒有那個問題 ya
幹,我智商好低喔
啊我就說我被抓來打牌
麻將ㄇ
好好喔
你要不要考慮一下 k-means
不是
我在打牌
隔壁在打麻將
R 不是,突然想到,還有數量欸(?
毀滅
[sticker](media:AAMCAQADHQI9ls-AAAEUX15eVUD_K7jvLGJSY_27MVO_IXMxxwACdCQAAtpxZgfHxtEl8R1pe64l1C8ABAEAB20AA6hPAAIYBA@telegram)
而且剛好只有八個人
啥數量
數量加權進去不就好了
1.1.1.1: 3這樣?
喔,我多重複幾次就可以了(?
Y
啊就變成[1.1.1.1,1.1.1.1,1.1.1.1]
就行
Y
但為什麼會有數量
阿不然你結果出來再乘數量
也不是不行
也是
不過不好(X
哪會wwwww
一開始進去的資料是 ips.keys()
最後出來 * ips[ip]
www
行ㄛ
我也覺得用 ASN + Whois + BGP 大概可以解決問題(
我覺得問 AdBlock 之類的東西也能解決問題(X
VPS:
你要這種隨機開的本來就無解啦
現在太鼓達人 web 板可以調 offset ㄌ
yay
@lekous 你算 dist 的在哪裡阿,沒看到 @@
我沒有喔
我照你原本的要求
給你集中程度的加權值而已
ㄟ我覺得很沒有信心ㄟ
這樣真的可以得到結果ㄇ
像是 webhosting 或是啥鬼ㄉ就會壞ㄌㄅ
y
人生真難R
所以才有加權分數
單一/32 match不一定會是最高的
但是數量一多
同/24底下如果一堆那match分數會更高
做log
只會加權到 VPS 拿到的 IP 段
沒有意義wwww
應該排除 VPS IP 段才對
你不太可能一次/24都在攻擊
um 對
但VPS外的可以
可是 vps 也不會拿到連續ip啊?
看是誰做ㄉvps
你不會拿到一段連續/23
或/25之類的
如果 ip pool 小到能連續拿到連續 ip 的,誤殺影響似乎也不大(喂
所以我那算法沒問題啊
這倒不一定ㄟ
vps 可以買 /24
只是要對mask做加權