c++和 Java 的 socket 通信协议解析请教 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
polandeme
V2EX    程序员

c++和 Java 的 socket 通信协议解析请教

  •  
  •   polandeme
    polandeme 2017-09-06 16:33:50 +08:00 5006 次点击
    这是一个创建于 2966 天前的主题,其中的信息可能已经有所发展或是发生改变。

    c++作为 client 发送固定协议的格式给 java,协议格式为:消息头加消息体
    消息头:0x786621cd XXXX(消息体长度)
    消息体:K:V

    现在用 java 接收之后,使用

    byte[] buffer = new byte[100000]; InputStream inputStream = socket.getInputStream(); int length = inputStream.read(buffer); String inputStr = new String(buffer, 0, length); 

    包体的数据是可以看到的,但是包头的信息是乱码。 好像是因为 c++那里包体是文本流,包体是二进制。所以想问一下:

    如何能够在 java 这里解析到包头信息呢?

    thx

    第 1 条附言    2017-09-07 09:51:10 +08:00
    头部解析已经完成,读出来前八个字节,然后依据大小端解析出来 body 长度。

    1. 但是就算拿到 body 长度,还是不确定有什么用途,以及如何解析 body ?

    2. body 是一个个 k:v 每个以回车分割, 一个字节一个字节的去读出来然后去分析?

    3. 还有就是 body 长度是为了防止在传输过程中的拆包和粘包么?
    20 条回复    2017-09-07 09:48:35 +08:00
    enenaaa
        1
    enenaaa  
       2017-09-06 16:42:14 +08:00
    可能是字节序不一致。
    这种跨编译语言的数据传输, 最好用文本格式,例如 json。或者支持跨平台的二进制格式, 例如 protobuf
    polandeme
        2
    polandeme  
    OP
       2017-09-06 16:47:16 +08:00
    @enenaaa 现在是客户端 c++那一部分是不可控不可改的
    nifury
        3
    nifury  
       2017-09-06 16:50:47 +08:00
    因为包头有个消息头? inputStr 跳过 buffer 前几个字节呗?
    polandeme
        4
    polandeme  
    OP
       2017-09-06 16:52:59 +08:00
    @nifury 那请问如何读取消息头呀
    enenaaa
        5
    enenaaa  
       2017-09-06 16:54:52 +08:00
    @polandeme 那你慢慢研究吧。 首先确定客户端发送数据的字节序, 可能是 Little-Endian 也可能是 Big-Endian。
    这个之后,再确定数据类型长度, 一般来说是可以解释的。
    nifury
        6
    nifury  
       2017-09-06 16:56:25 +08:00
    @polandeme 呃 buffer 前几个字节就是消息头呀
    canbingzt
        7
    canbingzt  
       2017-09-06 16:57:49 +08:00
    不是 String 就一个 byte 一个 byte 的读啊
    polandeme
        8
    polandeme  
    OP
       2017-09-06 16:58:32 +08:00
    @nifury 但是现在是前几个字节是直接读出来是乱码?
    我应该把 4-8 字节读出来然后转成 int?
    polandeme
        9
    polandeme  
    OP
       2017-09-06 16:58:59 +08:00
    @canbingzt 都四个 byte 然后转成 int?
    canbingzt
        10
    canbingzt  
       2017-09-06 17:03:20 +08:00
    buffer[0] == 0x78 && buffer[1] = 0x66 …………………………
    miclushine
        11
    miclushine  
       2017-09-06 17:03:50 +08:00
    建议你把收到的数据原封不动写到文件里,然后用二进制编辑器查看下,慢慢分析数据,看看是字节序还是哪里有问题。
    forcecharlie
        12
    forcecharlie  
       2017-09-06 17:14:39 +08:00
    C++ 应该是 UTF8, Java String 是 UTF16.

    你把客户端确定好 UTF-8, 然后 Java 使用 UTF-8 读取网络数据,网络传输几乎都是 UTF-8。UTF-8 不用考虑字节序。
    你的代码只需要将 buffer 转成 String 就行, 比如 C# 中是 System.Text.Encoding.UTF8.GetString(bytes)。
    ljcnot
        13
    ljcnot  
       2017-09-06 17:15:54 +08:00
    .net 平台用的字节序是小端字节序, Java 是大端字节序
    你.net 接受过来需要转换一下才行
    polandeme
        14
    polandeme  
    OP
       2017-09-06 17:20:12 +08:00
    @canbingzt
    @miclushine
    @forcecharlie
    @ljcnot
    c++是小端序的,java 应该是大端序的。所以就是说,我先拿到前 8 个字节,然后再取出来其中的 4-8 位,然后从小端转大端 int?
    jjianwen68
        15
    jjianwen68  
       2017-09-06 17:27:13 +08:00
    我以前写过一个 java 解析 c++格式的消息,当时用了一些 ByteBuffer 来转换数据,你可以看看这个类的 api
    odirus
        16
    odirus  
       2017-09-06 17:32:47 +08:00
    跨语言还是建议你直接用跨语言的 RPC 现成解决方案,自己捣鼓的话虽然能学到更多东西,但给自己埋了一堆定时炸弹
    ktlb
        17
    ktlb  
       2017-09-06 17:41:50 +08:00
    readInt 读取长度,然后根据长度读取 body
    WispZhan
        18
    WispZhan  
       2017-09-06 20:29:42 +08:00
    首先确认报文数据的总长度,是不是统一的。如果是,那就是大小端问题。

    如果不是,再看看两边是不是都用的 byte[]来传的。
    owt5008137
        19
    owt5008137  
       2017-09-07 08:51:38 +08:00 via Android
    映像中 java 的 String 是带编码的,应该是要直接操作 buffer,不能直接构造 String,或者你知道编码的话按指定编码转成 String
    polandeme
        20
    polandeme  
    OP
       2017-09-07 09:48:35 +08:00
    @ktlb 嗯嗯,先读取头部,然后依据大小端做了判断读了出来 body 长度,但是现在没有找到好的方法去分析 body,要一个 byte,一个 byte 的去读出来?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2948 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 31ms UTC 13:39 PVG 21:39 LAX 06:39 JFK 09:39
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86